3 月 31 日,新一期百度 AI DAY 上,文小言告示完制品牌焕新与功能升级。除品牌视觉形象焕新外,文小言聚焦模子绽开与功能翻新,相沿多模子交融调动,升级全新语音大模子、图片问答、AI 生图生视频等多项才调,为用户带来更智能、更高效的 AI 体验。ag九游会网站
百度 AI 居品翻新业务认真东说念主薛苏强调:" AI 的明天不再是单纯的技巧参数比拼,而是怎么通过多模子协同,确实为用户创造价值。文小言但愿通过绽开生态,整合顶尖模子才调,作念出更弘大、更浅易的 AI 居品。"
多模子交融:打造 AI "超等大脑",从头界说用户体验
文小言这次升级的中枢亮点在于"多模子交融调动"。通过整合百度自研的文心 X1、文心 4.5 等顶尖模子,并接入 DeepSeek-R1、可灵品级三方优质模子,文小言结束了多模子间的智能协同。用户只需遴荐"自动格式",即可一键调用最优模子组合,或凭证需求天真遴荐单一模子完成特定任务,大幅擢升反应速率与任务贬责才调。
以"盘算三种作风的南偏东客厅恶果图"为例,文小言概况精确默契装修作风互异,调用文心 X1 完成深度推理,生成三幅作风迥异但视角一致的装修恶果图;唾手拍摄一张茅台镇的像片,文小言就不错调用文心 4.5 的多模态分析才调,精确识别出地舆位置、当地产业、建立作风等详备信息。
功能升级:全新语音大模子、图片问答,解锁 AI 独揽新场景
这次功能升级,文小言进一步擢升了全新语音大模子、图片问答、AI 生图生视频等才调,全面优化用户体验。
全新语音大模子相沿方言对话、复杂学问问答及随时打断等场景,用户可进行语音学问问答或意念念变装演出。
百度语音首席架构师贾磊闪现,该模子是百度在业界首个推出、基于全新彼此关把稳力 ( Cross-Attention ) 的端到端语音话语大模子。在语音场景欢乐一定交互办法下,大模子调用资本比行业平均缩短 50%-90%,推理反应速率极快,将语音交互恭候时候压缩至 1 秒附近,极大擢升了交互通顺性。同期,在大模子加捏下,结束了流式逐字的 LLM 启动的厚脸色语音合成,脸色有余、传神、拟东说念主,交互听感也得到极大擢升。
图片问答功能让用户不错通过拍摄或上传图片,以笔墨或语音发问径直赢得深度默契。举例,拍摄一起数学题可及时生成解题念念路与视频默契;上传多款商品图可对比参数、价钱,提拔购物方案;拍摄杯子盘算图后,AI 可自动默契作风并生成同款手机壳、支架等相近居品。
值得一提的是,新增的"图个冷学问"功能更富意念念性,用户可预设"历史学者""科技达东说念主"等东说念主设视角,为兼并图片赋予多维解读。举例,当用户计划"猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量赢得、领地意志等角度给出独到解读。