HiveCoreRD/hivecore_robot_voice

Fork 0

Go to file

lxy 9c775cff5c 增加中断词

2026-01-12 17:40:08 +08:00

config

增加中断词

2026-01-12 17:40:08 +08:00

launch

增加相机调用，修复对话历史管理，修复asr停止识别逻辑

2026-01-08 20:59:58 +08:00

resource

update @huiyu

2026-01-05 09:53:18 +08:00

robot_speaker

增加中断词

2026-01-12 17:40:08 +08:00

.gitignore

chore: add .gitignore and stop tracking build/install/log outputs

2026-01-07 14:30:16 +08:00

LICENSE

Initial commit

2025-09-29 10:59:27 +08:00

package.xml

feat(robot_speaker): 创建语音包

2026-01-07 14:14:29 +08:00

README.md

feat(robot_speaker): 创建语音包

2026-01-07 14:14:29 +08:00

requirements.txt

增加相机调用，修复对话历史管理，修复asr停止识别逻辑

2026-01-08 20:59:58 +08:00

setup.cfg

update @huiyu

2026-01-05 09:53:18 +08:00

setup.py

feat(robot_speaker): 创建语音包

2026-01-07 14:14:29 +08:00

view_camera.py

增加中断词

2026-01-12 17:40:08 +08:00

README.md

ROS 语音包 (robot_speaker)

注册阿里云百炼获取api_key

https://bailian.console.aliyun.com/?tab=model#/api-key ->密钥管理放到config/voice.yaml

安装依赖

系统依赖

sudo apt-get update
sudo apt-get install -y python3-pyaudio portaudio19-dev alsa-utils ffmpeg

Python依赖

cd ~/ros_learn/hivecore_robot_voice
pip3 install -r requirements.txt --break-system-packages

编译启动

cd ~/ros_learn/hivecore_robot_voice
colcon build
source install/setup.bash
ros2 launch robot_speaker voice.launch.py

架构说明

[录音线程] - 唯一实时线程 ├─ VAD + 能量检测 ├─ 检测到人声 → 立即中断TTS └─ 音频chunk → 音频队列

[ASR推理线程] - 只做 audio → text └─ 从音频队列取chunk → ASR识别 → sentence_end → 文本队列

[主线程/处理线程] - 处理业务逻辑 ├─ 从文本队列取文本 ├─ 唤醒词处理 ├─ LLM处理（流式） └─ TTS文本 → TTS队列

[TTS播放线程] - 只播放 └─ 从TTS队列取文本 → 播放音频，响应中断标志

README.md Unescape Escape

ROS 语音包 (robot_speaker)

注册阿里云百炼获取api_key

安装依赖

编译启动

架构说明

README.md