rdk-x5-media

RDK X5 多媒体处理:音频录制/播放(arecord/aplay/PulseAudio)、hobot_codec 视频编解码、RTSP 拉流/推流、HDMI 分辨率配置、MIPI LCD 触摸屏适配、VNC 远程桌面服务端安装与配置。Use when the user wants to record or play audio, encode/decode video, configure HDMI output, set up LCD screen, use RTSP streaming to view camera on PC, set up VNC desktop server, or stream camera video to remote viewer. Do NOT use for VNC 连接失败排查 (use rdk-x5-network), running AI algorithms (use rdk-x5-ai-detect), camera hardware setup (use rdk-x5-camera), or system backup (use rdk-x5-system).

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "rdk-x5-media" with this command: npx skills add katherineedwards2475/rdk-x5-media

RDK X5 Media — 多媒体处理

操作步骤

1. 音频配置

# 选择音频设备(PulseAudio 通道同步,v3.4.1+)
sudo srpi-config
# → Audio Options

# 查看设备
aplay -l        # 播放设备
arecord -l      # 录音设备

支持音频子板:微雪 WM8960 Audio HAT、幻尔载板。

2. 音频录制与播放

# 录音(16kHz 单声道 16bit 5秒)
arecord -D plughw:0,0 -f S16_LE -r 16000 -c 1 -d 5 test.wav

# 播放
aplay test.wav

# PulseAudio 方式
parecord --rate=16000 --channels=1 test.wav
paplay test.wav

3. 视频编解码(hobot_codec)

source /opt/tros/humble/setup.bash

# NV12 → MJPEG 编码
ros2 launch hobot_codec hobot_codec_encode.launch.py

# RGB → MJPEG(USB 摄像头 YUYV 模式)
ros2 launch hobot_codec hobot_codec_encode.launch.py \
  codec_in_mode:=ros codec_in_format:=rgb8 \
  codec_sub_topic:=/image codec_pub_topic:=/image_mjpeg

ISP/VIO/编解码模块在 v3.4.1 经过大规模稳定性修复。

4. RTSP 拉流 + AI 推理

source /opt/tros/humble/setup.bash
ros2 launch hobot_rtsp_client hobot_rtsp_client.launch.py \
  rtsp_url:="rtsp://admin:password@192.168.1.64:554/stream1"

浏览器 http://<RDK_IP>:8000 查看结果。

5. WebSocket 实时预览

source /opt/tros/humble/setup.bash
ros2 launch websocket websocket.launch.py \
  websocket_image_topic:=/image_jpeg websocket_only_show_image:=true

6. HDMI 显示配置

xrandr                                           # 查看当前分辨率
xrandr --output HDMI-1 --mode 1920x1080          # 设置分辨率

v3.4.1 已优化多分辨率兼容性,v3.1.1 修复竖屏黑屏问题。

7. MIPI LCD 触摸屏

sudo srpi-config
# → Display Options → MIPI Screen

已适配型号:11.9寸微雪宽屏(v3.4.1)、7款微雪 MIPI DSI 屏(v3.0.1+)。

  • 支持双击和长按操作,长按模拟右键
  • v3.4.1 修复触摸坐标漂移

8. VNC 远程桌面

sudo srpi-config
# → Interface Options → VNC → Enable

常用命令

v4l2-ctl --list-devices                          # 列出视频设备
v4l2-ctl -d /dev/video0 --list-formats-ext       # 查看格式
v4l2-ctl -d /dev/video0 --set-fmt-video=width=1920,height=1080,pixelformat=MJPG \
  --stream-mmap --stream-to=frame.jpg --stream-count=1    # 截图

排查故障

现象原因解决
arecord 无设备音频子板未接或未配置srpi-config → Audio 选择设备
HDMI 无输出分辨率不兼容换低分辨率显示器测试;检查 xrandr
LCD 触摸偏移型号未正确选择srpi-config 重新选择屏幕型号
websocket 页面空白codec 未启动或 topic 不匹配确认 hobot_codec 节点运行中

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Coding

Rdk X5 App

运行 RDK X5 /app 目录下的预装示例程序:12 个 Python AI 推理 demo(YOLO/分类/分割/Web展示)、40pin GPIO 示例、C++ 多媒体示例(编解码/RTSP/VIO)、查看 34 个预装 BPU 模型。Use when the user wants to run pre-...

Registry SourceRecently Updated
0101
Profile unavailable
Automation

Rdk X5 Ai Detect

在 RDK X5 的 10TOPS BPU 上运行单个 AI 推理算法:YOLO 目标检测、图像分类、语义分割、人脸识别、手势识别、人体关键点、开放词汇检测(DOSOD/YOLO-World)、双目深度估计、语音识别、端侧轻量 LLM(≤2B 参数量化模型)。Use when the user wants to...

Registry SourceRecently Updated
071
Profile unavailable
Automation

Rdk X5 Tros

使用 RDK X5 上的 TogetheROS.Bot (tros.b) Humble 框架:启动 43 个预装 ROS2 算法包、管理 ROS2 话题/节点/服务、构建摄像头+AI+输出(Web/语音/HDMI)集成 pipeline、创建自定义 ROS2 工作空间。Use when the user ment...

Registry SourceRecently Updated
075
Profile unavailable