提交需求
赛事与广告咨询合作,请填写需求表单,我们会在第一时间与您联系!
AI设计观察是MEUX发起的体验洞察系列内容,定期汇总国内外设计动态,为大家带来最新行业资讯。
【1】Perplexity推出AI驱动浏览器Comet
【2】谷歌发布32个T5Gemma模型
【3】马斯克xAI发布Grok4
【4】新版 PNG 格式发布
【5】B站推“代号H”AI创作工具
【6】京东推出两款AI社交产品
【7】字节上线“小荷AI医生”
【8】vivo发布端侧多模态模型
【9】腾讯元器接入微信支付MCP
【10】字节发布Xverse图像生成模型
1.Perplexity推出AI驱动浏览器Comet
Perplexity 推出首款 AI 驱动网页浏览器 Comet,旨在挑战谷歌搜索作为用户获取信息主要途径的地位。该浏览器初期向每月 200 美元的 Max 计划订阅者及少量等待名单邀请用户开放,核心特色是预装并默认设置 Perplexity 的 AI 搜索引擎,突出展示其核心产品 ——AI 生成的搜索结果摘要。同时,浏览器内置全新 AI 助手 Comet Assistant,可自动完成日常任务,如总结邮件和日历事件、管理标签页、代用户浏览网页等,用户可通过侧边栏调用该助手,使其查看网页内容并解答相关问题。
2.谷歌发布32个T5Gemma模型
谷歌发布编码器 - 解码器架构的 T5Gemma 系列模型,同时还推出了用于健康 AI 开发的多模态模型 MedGemma。T5Gemma采用 “适应” 技术,将预训练的仅解码器模型转换为编码器 - 解码器架构,可灵活组合不同大小模型,平衡质量与效率。实验显示,T5Gemma 在多个基准测试中表现优异,尤其在推理密集型任务上,相比仅解码器的 Gemma 2 有显著提升,被认为可能推动编码器 - 解码器架构复兴。MedGemma 包含 4B 和 27B 大小的模型,能辅助医疗诊断,表现良好。
3.马斯克xAI发布Grok4
马斯克旗下 AI 公司 xAI 发布最新旗舰大模型Grok 4 及多智能体版本 Grok 4 Heavy,并推出每月 300 美元的高价订阅计划 Super Grok Heavy。在 “人类的最后考试” 中,Grok 4 无工具时准确率 25.4%,超谷歌 Gemini 2.5 Pro 和 OpenAI o3;Grok 4 Heavy 带工具得分 44.4%,表现亮眼。其在多学科测评中成绩优异,马斯克称其科研能力超人类博士,还能处理源代码文件。此外,Grok 4 已在库存管理、游戏创作等领域落地,未来还将推出编码、多模态、视频生成等模型,与 OpenAI 的 GPT-5 形成竞争态势。
4.新版PNG格式发布
新版PNG格式规范发布,沉寂20余年的PNG格式重焕活力。美国国会图书馆等机构均推荐该格式,此次更新由 Adobe、苹果、谷歌等多巨头参与推动。新功能包括:一是完善 HDR 支持,仅用 4 字节即可实现,且具备前瞻性;二是正式认可 APNG 动画格式,此前该格式已获广泛支持;三是官方支持 Exif 数据,可存储版权、GPS 等附加信息,同时还进行了错误修正和说明澄清等整理工作。目前,Chrome、Photoshop 和Safari 等众多程序已支持新版 PNG 规范,广播领域的硬件和工具也在更新适配。后续计划推出第四版更新以提升 HDR 与 SDR 的互操作性,第五版将研究压缩优化及并行编解码功能。
5.B站推“代号H”AI创作工具
B站推出 “代号 H” AI 创作工具,聚焦视频播客领域,该工具可实现音频内容视频化,支持文案、音频输入,适配播客和泛知识杂谈图文模板,能在 6 分钟内生成千字内容视频,未来预计缩至 3 分钟,定向邀请用户体验反馈超预期。
6.京东推出两款AI社交产品
京东在其 App 内推出两款 AI 社交产品 “宠 TA” 和 “聊愈小宇宙”,虎牙则推出首个 AI 助手产品 “小虎 AI 加工坊”。“宠 TA” 是以宠物为中心的 AI 社区产品,用户可与宠物或宠物数字人形象的智能体聊天,兼具换装、宠物数字人等可玩性功能,还设有宠物医生咨询、食品购买专区,将情感陪伴与消费场景结合,形成 “边玩边买” 闭环。“聊愈小宇宙” 是 AI 类对话产品,能识别用户情绪,提供情绪记录、解压游戏等服务,用户可与 AI 心理咨询师聊天,还可在 “微光社区” 交流,同时提供专业心理咨询师付费服务,增强用户认同感。
7.字节上线“小荷AI医生”
字节首款 AI 医疗助手独立 App “小荷 AI 医生” 上线,定位健康管家,提供健康咨询、报告解读等服务。用户注册登录后进入对话界面,可咨询疾病自查、用药参考等健康问题,AI 会主动收集关键信息(如症状持续时间),并通过让用户上传诊断报告、拍摄病灶图片等方式,结合信息给出建议。其还能解读血常规等报告,快速分析指标异常,评估状况并给出建议;支持拍摄药盒查询药效说明。2024 年中国 AI 医疗器械市场规模达 96.41 亿元,预计 2025 年将达 242.3 亿元,大厂竞速或重新定义 AI 健康边界。
8.vivo发布端侧多模态模型
vivo AI Lab 发布端侧多模态模型 BlueLM-2.5-3B,参数量仅 2.9B,专为端侧设计,紧凑高效。该模型融合文本与图文理解推理能力,支持长短思考模式切换及思考预算控制,可直接理解 GUI 界面。在 20 余项评测中表现突出:文本任务上,缓解多模态模型文本能力遗忘问题,与同规模文本模型效果相近,优于同规模及更大规模多模态模型;多模态任务领先同规模模型,部分接近大规模模型;GUI 理解能力在同规模模型中领先,尤其中文场景表现优异。
9.腾讯元器接入微信支付MCP
腾讯元器宣布正式接入微信支付 MCP,成为首个接入该支付解决方案的智能体开发平台。这一举措支持开发者在智能体上直接添加下单、赞赏、查询订单等功能,打通了智能体商业化的最后环节。开发者仅需通过简单的提示词调用或工作流编排,就能快速接入微信支付 MCP,使智能体具备支付能力。目前,元器平台已向开发者开放微信支付 MCP 的体验版本,正式版本将在资质审核通过后开放。
10.字节发布Xverse图像生成模型
字节发布多主体控制生成模型 Xverse,可对设定的每个主体进行精确控制,且不破坏图像生成质量,能应对多主体、多光源、多风格等场景。其核心是通过学习 DiT 中文本流调制机制中的偏移量,实现对多个主体身份和语义属性的一致控制,包含 T-Mod 适配器、文本流调制机制、VAE 编码图像特征模块及两种正则化技术等关键组成部分。对比测试显示,Xverse 在单主体、多主体任务及整体表现上均优于 MS-Diffusion、OmniGen 等领先技术。
感谢阅读,转载请注明出处,违者必究,谢谢您的合作。申请转载授权后台回复【转载】。MEUX招聘进行中,交互/视觉/用研可投简历至meux-talent@baidu.com(请在邮件中务必明确标注信息来源,例如:来自MEUX UI中国)
关于我们:
MEUX,百度移动生态用户体验设计中心,负责百度移动生态体系的用户/商业产品的全链路体验设计。服务的产品包括百度APP、百度搜索、百度百科、百度贴吧、百度商业产品等。MEUX以「简单极致」为设计理念,创造极致用户体验的同时赋能商业,推动设计行业的价值和影响力,让生活因设计而更美好。
Powered by Froala Editor
大牛,别默默的看了,快登录帮我点评一下吧!:)
登录 立即注册