8fffd4ab427ddde7e145e801308825e9b330d0aa
ROS 语音包 (robot_speaker)
注册阿里云百炼获取api_key
https://bailian.console.aliyun.com/?tab=model#/api-key ->密钥管理 放到config/voice.yaml
安装依赖
- 系统依赖
sudo apt-get update
sudo apt-get install -y python3-pyaudio portaudio19-dev alsa-utils ffmpeg
- Python依赖
cd ~/ros_learn/hivecore_robot_voice
pip3 install -r requirements.txt --break-system-packages
编译启动
cd ~/ros_learn/hivecore_robot_voice
colcon build
source install/setup.bash
ros2 launch robot_speaker voice.launch.py
架构说明
[录音线程] - 唯一实时线程 ├─ VAD + 能量检测 ├─ 检测到人声 → 立即中断TTS └─ 音频chunk → 音频队列
[ASR推理线程] - 只做 audio → text └─ 从音频队列取chunk → ASR识别 → sentence_end → 文本队列
[主线程/处理线程] - 处理业务逻辑 ├─ 从文本队列取文本 ├─ 唤醒词处理 ├─ LLM处理(流式) └─ TTS文本 → TTS队列
[TTS播放线程] - 只播放 └─ 从TTS队列取文本 → 播放音频,响应中断标志
Description
Languages
Python
100%