欢迎来到【 AI 日报】栏目! 这里是你每天探索人工智能世界的指南,每天我们为你呈现 AI 领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新 AI 产品应用。
新鲜 AI 热点点击了解: https://momodel.cn/news
1.字节跳动推出 StoryMem 系统,解决 AI 视频生成中的角色一致性问题
字节跳动与南洋理工大学的研究团队联合开发了 StoryMem 系统,旨在解决 AI 生成视频时角色在不同场景中外观不一致的问题。该系统通过存储关键帧并在后续场景生成时参考,从而保持角色和环境的一致性。研究结果显示,StoryMem 在跨场景一致性上提升了 28.7%,但其在复杂场景中仍存在挑战,需要更明确的角色描述以提高生成效果。

【AiBase提要:】
🌟 StoryMem 系统能够有效解决 AI 视频生成中角色和环境不一致的问题。
📊 通过存储关键帧,StoryMem 在跨场景一致性方面比现有模型提升了28.7%。
🛠️ 该系统在处理复杂场景时仍面临挑战,需对角色进行明确描述以提升生成效果。
详情链接:https://kevin-thu.github.io/StoryMem/
2、月之暗面再推多模态新模型,Kimi K2 升级版拟于第一季度亮相
月之暗面计划在2026年第一季度推出多模态模型K2.1/K2.5,该模型将基于其万亿参数开源模型Kimi K2进行升级,进一步提升多模态处理与智能体能力。公司目前拥有超过100亿元人民币的现金储备,为持续研发提供了充足底气。
【AiBase提要:】
🚀 月之暗面计划在2026年第一季度推出多模态模型K2.1/K2.5,提升多模态处理与智能体能力。
🧠 新模型基于万亿参数开源模型Kimi K2升级,支持“边思考、边工具协作”的Thinking模型。
💰 月之暗面拥有超过100亿元人民币的现金储备,为持续研发提供充足底气。
3、AI眼镜新王者诞生!“灵魂电脑”Pickle 1,能记住你一生所有事
Pickle1是一款融合AR显示与高级AI的智能眼镜,被定位为“灵魂电脑”,通过持续捕捉用户视觉与音频上下文,实现无限记忆、情感理解与主动交互。

【AiBase提要:】
🧠 Pickle1通过主动学习用户生活习惯,将日常经历转化为可搜索的“记忆泡”(memory bubbles)
👓 Pickle1采用轻量化设计,支持全天佩戴,并提供双目全彩AR显示和高通Snapdragon AI引擎
🔒 Pickle1强调数据本地处理,使用硬件隔离加密,确保用户隐私安全
4、清华与 OpenBMB 联合推出 UltraEval-Audio:音频模型评测新框架开源发布
UltraEval-Audio 是由清华大学 NLP 实验室、OpenBMB 和面壁智能联合开发的音频模型测评框架,其最新版本 v1.1.0 增加了对热门音频模型的一键复现功能,并扩展了对 TTS、ASR 和 Codec 等专业模型的支持。该框架的开源将显著提升研究者在音频模型开发中的效率,推动相关领域的研究进展。
【AiBase提要:】
🌟 UltraEval-Audio 是专为音频模型设计的测评框架,由多家机构联合开发。
🚀 最新版本 v1.1.0 新增一键复现功能,支持更多专业模型的评测。
📈 开源发布将提升研究者开发效率,推动音频模型领域的发展。
详情链接:https://github.com/OpenBMB/UltraEval-Audio
5、OpenAI押注“语音优先”未来!整合多团队重造音频模型,首款AI音频硬件或明年问世
文章分析了OpenAI在语音交互领域的战略布局,强调其通过重构音频系统,推动人机交互进入后屏幕时代,并探索音频优先的硬件产品,以争夺用户注意力资源。
【AiBase提要:】
🎙️ OpenAI重构音频战略,预计2026年推出音频优先个人设备。
🔊 新音频模型将实现更自然的语音合成和真实对话式打断。
📱 OpenAI计划推出无屏智能音箱、AI眼镜或可穿戴设备,目标是成为用户的“智能伴侣”。
6、无限薅 Gemini 额度神器Antigravity!一键切换多账号,告别 AI 限流烦恼
Antigravity Tools是一款开源桌面应用,通过智能账号管理和无缝切换功能,帮助用户无限扩展Gemini、Claude等顶级模型的使用时长,成为AI社区热门话题。

【AiBase提要:】
🧠 实时额度监控:应用可全局监控多个AI账号的剩余额度与健康状态。
🔄 自动推荐最佳账号:系统基于实时算法,智能筛选配额充足的账号,并支持一键无缝切换。
🌐 多协议兼容:支持将Web端Session转化为标准化API接口,解决不同厂商协议差异问题。
详情链接:https://github.com/lbjlaq/Antigravity-Manager
7、元象开源XVERSE-Ent大模型!聚焦泛娱乐场景,中英双语支持,填补行业专属模型空白
元象科技开源了面向泛娱乐行业的专属大模型XVERSE-Ent,该模型在社交互动、游戏叙事和文化创作方面表现出色,并提供了多参数版本以适应不同需求。
【AiBase提要:】
🎮 专为泛娱乐场景优化,支持社交互动、游戏叙事和文化创作。
🧩 提供多参数版本,部署友好且开源协议商用友好。
🌐 中英双语支持,融入大量中文网络文学与多语言影视文本。
8、苹果回应“AI 功能疑似阉割”:切勿通过第三方绕开限制,警惕账号风险
苹果官方正式回应了关于国行版 Apple 智能开启灰度测试的传闻,明确表示目前尚未上线,并提醒用户不要通过第三方软件强行激活 AI 功能,以免造成安全风险。
【AiBase提要:】
苹果官方确认 Apple 智能尚未在国行版本上线,一切以官网公告为准。
Apple 智能对硬件性能要求极高,仅 iPhone15Pro 及更新机型兼容。
苹果警告用户避免通过第三方软件强行激活 AI 功能,以防账号和资金安全风险。


评论 (0)