火山引擎 AI 创新巡展上海站展示豆包大模型, 在语音识别和对话式 AI 实时交互方面取得进展。发布的 Seed-ASR 成果与 OpenAI 的 ChatGPT 高级语音模式类似。豆包支持多种中国方言, 并测试了 AI 文本伴读、截图识别、AI 看视频和 AI 方言识别等功能。AI 文本伴读提供 22 项模块功能, AI 图片识别解题功能表现良好但翻译和问答功能有待改进, AI 看视频功能基本准确地进行内容切分, AI 方言识别支持输入但不支持交互。
来源:https://tech.ifeng.com/c/8cJAUb5AvdE