商汤商量大语言模型:日日新 5.0 体系加持,多语言交互助力金融医疗教育行业 AI 应用
? 技术突破:从实验室到产业级落地的跨越
商汤 “日日新 5.0” 大模型体系的发布,标志着国产大模型从通用能力向垂直领域深度渗透的重要里程碑。这个基于混合专家架构(MoE)的模型,通过超过 10TB tokens 训练和逻辑型合成思维链数据的注入,在知识储备、数理推理、多模态交互等核心指标上全面对标 GPT-4 Turbo,甚至在部分场景实现超越。
? 测评实力:中文场景下的王者表现
在国内权威大模型测评机构 SuperCLUE 的测试中,“日日新 5.0” 以总分 80.03 分刷新国内最好成绩,尤其在文科任务上以 82.20 分登顶,长文本处理、生成创作、角色扮演等能力全球领先。例如,在《红楼梦》亭子题名的作文创作中,“日日新 5.0” 引经据典、逻辑连贯,远超 GPT-4 的套路化表达。数学推理上,它能准确识别 “老鹰抓小鸡” 问题中的中文语境陷阱,给出更符合实际的答案。
? 金融行业:重塑智能决策与服务体验
商汤与海通证券等金融机构合作,打造智能客服与投研服务体系。通过挂载金融知识库,模型能 100% 基于产品说明进行精准问答,实时更新市场数据,辅助生成研报和投资策略。例如,在分析 F1 车手周冠宇的参赛数据时,“办公小浣熊” 助手不仅能自动匹配拼音与汉字,还能生成雷达图直观展示车手表现。多语言交互能力支持跨国金融服务,例如阿拉伯语、粤语等小语种的智能客服,有效降低跨境业务的沟通成本。
? 医疗行业:AI 赋能精准诊疗与效率提升
基于千亿参数的 “商量” 模型,商汤研发的医疗健康大模型 “大医”,可实现检验检查问答、电子病历生成、辅助诊断决策等多项任务。以脑卒中为例,医生通过多模态模型 1 分钟内即可获得专业建议,大幅缩短诊断时间。在江苏省第一人民医院,搭载 “日日新 5o” 的飞燕机器人通过情绪识别和多模态交互,完成心理健康筛查和个性化干预,减少患者面对真人时的焦虑。多语言支持在跨国医疗协作中尤为关键,例如中英文病历的实时翻译,确保诊疗信息的准确传递。
? 教育行业:构建沉浸式学习与个性化教学
商汤与新东方国际教育合作,利用 “如影” 平台生成数字人老师,将留学指南快速转化为 100 个问答视频,大幅提升内容生产效率。在校园心理小屋中,AI 机器人提供心理咨询服务,通过情感支持和多模态感知助力心理健康教育。端侧大模型的快速推理能力(中端手机 18.3 字 / 秒)让离线场景下的作业辅导成为可能,例如生成员工休假申请或总结工作纪要。与编程猫的合作则将 AI 融入编程教育,通过多模态交互提升学生的实践能力与创新思维。
? 多语言交互:打破语言壁垒,释放全球价值
“日日新 5.0” 支持粤语、阿拉伯语等小语种,结合多模态能力实现跨语言的图文理解与生成。例如,在打车软件截图的信息提取中,模型能准确识别双卡双待信号和车牌细节,而 GPT-4 存在识别错误。在金融领域,多语言智能客服可同时处理中英文咨询,提升跨国客户满意度;医疗场景中,多语言病历翻译降低了国际医疗协作的沟通成本。
? 端云协同:全栈布局满足多样化需求
商汤率先完成 “云、端、边” 全栈布局,端侧大模型在中端平台实现 18.3 字 / 秒的生成速度,旗舰平台达 78.3 字 / 秒,推理成本降低 80%。例如,小米汽车 SU7 的小爱同学通过端云协同方案,在车机交互中实现毫秒级响应。企业级大模型一体机支持本地化部署,在金融、医疗等领域实现数据隐私与高效推理的平衡。
? 未来展望:从工具到伙伴的进化
随着 “日日新 5o” 实时音视频交互版的推出,模型交互延迟缩短至 2 秒以内,支持超长记忆和个性化设置,例如扮演《射雕英雄传》中的角色进行对话。在教育领域,灵宇宙的 AI 学伴小方机结合 “日日新 V6 Omni” 模型,将物理世界转化为教材,实现 “万物即课堂” 的沉浸式学习。未来,端侧智能体的发展将进一步解放双手,通过语音指令调用手机应用完成任务,开启人机协作的新篇章。
结语
商汤 “日日新 5.0” 凭借技术领先性、行业深度融合和全栈布局能力,正在重新定义 AI 在金融、医疗、教育等领域的应用范式。从精准诊疗到智能投研,从个性化学习到跨国协作,这个大模型体系不仅是技术的突破,更是产业升级的催化剂。随着端侧模型的普及和多语言能力的深化,商汤有望成为全球 AI 生态中不可或缺的中国力量。
该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具。