ROS 语音包 (robot_speaker)

注册阿里云百炼获取api_key

https://bailian.console.aliyun.com/?tab=model#/api-key ->密钥管理 放到config/voice.yaml

安装依赖

  1. 系统依赖
sudo apt-get update
sudo apt-get install -y python3-pyaudio portaudio19-dev alsa-utils ffmpeg
  1. Python依赖
cd ~/ros_learn/hivecore_robot_voice
pip3 install -r requirements.txt --break-system-packages

编译启动

cd ~/ros_learn/hivecore_robot_voice
colcon build
source install/setup.bash
ros2 launch robot_speaker voice.launch.py

架构说明

[录音线程] - 唯一实时线程 ├─ VAD + 能量检测 ├─ 检测到人声 → 立即中断TTS └─ 音频chunk → 音频队列

[ASR推理线程] - 只做 audio → text └─ 从音频队列取chunk → ASR识别 → sentence_end → 文本队列

[主线程/处理线程] - 处理业务逻辑 ├─ 从文本队列取文本 ├─ 唤醒词处理 ├─ LLM处理流式 └─ TTS文本 → TTS队列

[TTS播放线程] - 只播放 └─ 从TTS队列取文本 → 播放音频,响应中断标志

Description
No description provided
Readme Apache-2.0 737 KiB
Languages
Python 100%