欢迎来到【 AI 日报】栏目! 这里是你每天探索人工智能世界的指南,每天我们为你呈现 AI 领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新 AI 产品应用。
新鲜 AI 热点点击了解: https://momodel.cn/news
1、字节跳动发布端到端同声传译模型 Seed LiveInterpret 2.0
字节跳动Seed团队推出了最新研发成果——Seed LiveInterpret 2.0,该模型在中英同传翻译质量上达到业界顶尖水平,具备低延迟和实时声音复刻功能,显著提升了跨语言交流的自然度和流畅性。
【AiBase提要:】
🚀 Seed LiveInterpret 2.0实现了接近真人同传的翻译准确率,且延迟极低,仅需3秒。
🎙️ 支持实时声音复刻功能,无需提前采集声音样本即可合成“原声”语音翻译。
📊 在专业评测中,Seed LiveInterpret 2.0在中英互译任务中表现优异,评分远超其他系统。
详情链接:https://arxiv.org/pdf/2507.17527
2、秘塔搜索 API 上线:定价3分钱 提供多模态搜索能力
秘塔 AI 搜索正式推出其搜索 API,为开发者提供了一个替代 Bing Search API 的新选择。该 API 定价0.03元/查询,支持多模态搜索,并且无使用门槛,便于快速接入。
【AiBase提要:】
✅ 秘塔 AI 搜索 API 正式上线,为开发者提供新的搜索替代方案。
💡 定价0.03元/查询,具有市场竞争力,支持多模态搜索。
🚀 开发者可即测即用,无需复杂申请流程,提升接入效率。
3、Lovart AI 正式版全球发布:全链路智能设计重塑创作体验
文章介绍了 Lovart AI 正式版的全球发布,强调其作为首个人工智能设计 Agent 的创新性,以及其通过自然语言交互和全链路设计能力重新定义设计行业标准。文章还提到其新功能 ChatCanvas 和针对中国市场的“星流 Agent”,并指出其对设计行业的深远影响。
【AiBase提要:】
🎨 Lovart AI 通过自然语言交互和全链路设计能力,提供高质量视觉资产生成服务。
🧠 新功能 ChatCanvas 支持多轮对话和实时调整布局、配色等,提升创作效率。
🇨🇳 针对中国市场优化的“星流 Agent”支持中文语义和国风审美,助力本土创作者高效创作。
4、李沐团队发布 Higgs Audio v2,开创语音合成新纪元
李沐团队推出的Higgs Audio v2是语音合成领域的一次重大突破,具备多语言对话生成、韵律自动调整和声音克隆等功能。该模型融合了1000万小时的语音数据进行训练,在多项测试中表现出色,成为行业标杆。
【AiBase提要:】
🔥 Higgs Audio v2支持多语言对话生成与声音克隆,实现复杂任务。
📊 在EmergentTTS-Eval测试中,Higgs Audio v2在情绪和问题类别中表现优异。
🚀 支持实时语音聊天和音频内容创作,适用于虚拟主播和语音助手等场景。
5、Sora2浮出水面:OpenAI 欲在生成式AI视频领域重夺C位
文章介绍了OpenAI正在开发其文本到视频模型Sora的继任者Sora2,同时提到谷歌Veo3的普及情况。这表明生成式AI视频领域的竞争将更加激烈。
【AiBase提要:】
🚀 OpenAI正在积极开发Sora2,以应对谷歌Veo3的竞争。
💡 Sora2尚未公开发布,但未来几周内可能有更多消息。
🌐 谷歌Veo3已向大学生免费开放,并可通过Google Cloud体验。
6、OpenAI与Oracle携手扩展Stargate项目,已创造数千个工作岗位
OpenAI与Oracle达成新协议,将Stargate项目在美国的数据中心容量扩大至4.5吉瓦,整体容量超过5吉瓦。这标志着OpenAI在2029年前实现10吉瓦目标的重要一步。该项目旨在推动美国成为全球人工智能发展的主导力量,并吸引了多家科技公司和国际投资者的参与。
【AiBase提要:】
🔥 Stargate项目容量扩大至超过5吉瓦,目标是到2029年实现10吉瓦。
🤝 OpenAI与Oracle等多家科技公司联合推动项目,预计将创造超10万个工作岗位。
💰 项目获得了超过190亿美元的资金支持,吸引了多国投资者参与。
7、Google Photos新增AI功能:照片秒变动漫、一键生成视频
Google Photos推出了多项基于AI的新功能,包括将静态照片转化为动态视频以及将照片转换为不同艺术风格的创意工具。这些功能旨在提升用户的创作体验,并通过实验性方式不断优化产品。
【AiBase提要:】
📷 照片转视频功能利用Veo2模型,让用户轻松将静态照片变成6秒动态视频。
🎨 Remix功能由Imagen AI驱动,可将普通照片转换成动漫、漫画等艺术风格。
📌 Google在Photos应用中新增了‘创建’标签页,整合多种创意工具,提供一站式创作体验。
8、YouTube Shorts将推全新AI特效 照片秒变视频!
YouTube宣布为Shorts创作者开放一系列革命性的生成式AI功能,包括图片转视频和AI特效。这些工具能够将静态照片转化为动态视频,并提供多种创意选项,显著降低了创作门槛,同时提升了内容的吸引力。
【AiBase提要:】
📷 图片转视频功能让静态照片在6秒内获得生命力,提升短视频创作效率。
🎨 AI特效可将涂鸦、自拍等简单素材转化为精美艺术作品,激发创作者灵感。
🎥 新一代Veo3视频生成器将同步生成音频,提供更完整的创作解决方案。
9、谷歌推出 Aeneas 模型:为古代文本解读开辟新路径
谷歌推出的 Aeneas 模型为古代铭文的解读提供了全新的方法,通过人工智能技术加速了历史学家对铭文的恢复、鉴定和年代定位工作,同时还能扩展到其他古代语言和材料,极大地提升了历史研究的效率和深度。
【AiBase提要:】
🧠 Aeneas 模型由谷歌 DeepMind 推出,旨在帮助历史学家理解古代文本。
🗣️ 该模型能够分析古代文本的相似性,填补文本空白,减轻历史研究者的负担。
📜 Aeneas 将文本转化为 “历史指纹”,帮助历史学家在更广泛的背景下解读铭文。
详情链接:https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
10、GitHub Spark横空出世:一句话打造Web应用,AI开发进入新时代!
GitHub Spark通过自然语言处理技术,让开发者和非开发者都能快速构建个性化Web应用,显著降低了编程门槛,并为微应用开发提供了全新可能。
【AiBase提要:】
🌟 GitHub Spark允许用户通过自然语言描述需求,快速生成完整的Web应用。
🚀 提供全托管运行环境,支持一键部署和PWA适配,简化了开发流程。
🔧 支持多模型选择,与GitHub生态深度整合,提升开发效率。
详情链接:https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-cop ilot-pro-subscribers/
11、华为M-Pencil Pro发布:699元 支持一键唤起小艺智能助手
华为发布了全新一代手写笔HUAWEI M-Pencil Pro,定价699元,具备16384级压感、侧旋功能和多种笔尖选择,同时支持AI功能快捷入口和星闪精确查找功能,为创作者带来更便捷和真实的创作体验。
【AiBase提要:】
✨ HUAWEI M-Pencil Pro拥有16384级压感,精准感应力度变化,提升创作真实感。
💡 笔尾智慧键采用鸿蒙星环设计的呼吸灯,可一键唤起小艺智能助手,提升操作便捷性。
📍 星闪精确查找功能支持50米范围内的精确定位,解决手写笔丢失问题。
评论 (0)