欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:
https://top.aibase.com/

1、腾讯混元开源发布0.5B、1.8B、4B、7B模型

腾讯混元团队推出四款适用于消费级GPU和低功耗场景的小规模开源模型,支持垂直领域高性价比的微调。这些模型在推理速度、成本效益和长文本处理能力方面表现出色,并已在多个开源平台上推出。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

✨ 四款小规模机型专为消费类设备设计,适用于各种低功耗场景。

🚀 这些模型具有快速推理和长文本处理能力,能够一次处理极长的内容。

🔧 支持多种部署方式,适合从边缘到云的多样化需求。

更多详情:https://hunyuan.tencent.com/modelSquare/home/list

2、昆仑万智发布并开源全新推理大模型MindLink

昆仑万智发布并开源最新推理大模型Skywork MindLink。该模型通过创新的推理框架实现了动态路径选择,提高了答案的透明度和效率,并在多次评估中取得了优异的成绩。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🧠 Skywork MindLink采用基于计划的推理新范式,优化多回合对话体验。

🏆 在多项基准测试中表现出色,在数学竞赛中获得多枚金牌。

🔧 内置自适应推理系统,根据任务难度自动调整生成策略。

更多详情:https://github.com/SkyworkAI/MindLink

3、哔哩哔哩推出AI语音翻译功能:保留UP原有语音音调,解决动漫文化走出去难题

哔哩哔哩推出自研AI语音翻译功能,解决国际国内版本合并后的内容互通问题。该技术可以保留UP原有的语音音调、语音特征和说话习惯,为海外用户提供更自然的中文内容体验。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

✅ 哔哩哔哩推出AI语音翻译功能,支持英文翻译,保留UP原有的语音语气和语音。

🔄 使用对抗性强化学习和深度研究技术来确保准确翻译,同时保留文化细微差别。

🌐 未来将扩大对日语等更多语言的支持,助力哔哩哔哩的国际化战略。

4. Google Gemini 2.5 Deep Think 发布!IMO金牌增补,AI新王者能否重塑未来?

谷歌DeepMind发布的Gemini 2.5 Deep Think模型在多个领域展现出了出色的推理能力,尤其是在2025年的国际数学奥林匹克竞赛中获得了金牌。该模型引入了并行思维和强化学习技术,增强了复杂任务的处理能力,在编码和跨领域知识测试中表现出色。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🧠 引入并行思维机制,增强解决复杂问题的能力。

🏆 在IMO竞赛中获得金奖,展示了顶级的数学推理能力。

🚀 支持多模态、长上下文,适用于多种场景。

5. OpenAI CEO展示GPT-5新功能,可高效整合在线信息

OpenAI首席执行官Sam Altman在社交媒体上分享了GPT-5的聊天记录,展示了其强大的信息整合能力。GPT-5 对科幻动画《万神殿》给予了正面评价,并提到该剧在烂番茄上获得了 100% 的正面评价。这一事件标志着GPT-5的首次公开亮相,引起了科技行业的广泛关注。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🌟 GPT-5首次公开亮相,展示了其强大的信息整合能力。

📺 OpenAI CEO推荐了科幻动画《万神殿》,并分享了该模型的正面评价。

🔍 GPT-5在烂番茄网站上的评分为“100%评论家认可”,引发广泛关注。

6. 苹果组建 AI 答案引擎团队:挑战 ChatGPT,或将重塑 Siri 和 Safari 搜索体验

苹果公司组建了专门的团队,开发类似于ChatGPT的AI应用,旨在提升其核心产品的搜索和交互体验。该团队名为 Answers, Knowledge, and Information,专注于构建一个可以使用在线信息回答用户问题的答案引擎。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🍎 苹果成立了一个新团队来开发类似于 ChatGPT 的人工智能应用程序,以增强搜索和交互体验。

🔍 答案引擎可以是独立的应用程序,也可以集成到 Siri 和 Safari 等产品中,提供更智能的搜索功能。

🌐 苹果希望减少对第三方AI服务的依赖,并应对谷歌反垄断案的影响。

7、高德地图宣布全面AI转型,推出全球首个AI原生地图应用“高德地图2025”

高德地图正式推出全球首个AI原生地图应用——高德地图2025,标志着其技术领域的重大突破。该应用结合空间智能技术,通过多模态信息感知增强地图智能化,将在多个领域产生积极影响。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🚀 高德地图推出全球首个AI原生地图应用,实现技术突破。

🧠 空间智能技术增强了地图的多模态信息感知能力。

🚗 应用将扩展到智能汽车、智能眼镜等领域,提高出行效率。

8. Adobe Photoshop推出“Harmonize”:利用AI自动匹配光线,实现无缝图像合成

Adobe 通过一系列生成式 AI 工具(例如“Harmonize”)简化了复杂的图像编辑过程,提高了图像合成和修改的效率,并引入了内容凭证以确保图像的真实性。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🖼️ “和谐”工具会自动匹配图像元素的光线、颜色和阴影,实现无缝合成。

🔍 人工智能驱动的图像增强功能可以在不损失质量的情况下将分辨率提高到 800 万像素。

🔒 内容凭据功能为图像的编辑历史记录提供了可靠的跟踪链,确保数字内容的真实性。

9. NVIDIA 推出 Cosmos DiffusionRenderer:革命性的视频渲染技术

NVIDIA 推出了 Cosmos DiffusionRenderer,这是一种新的视频扩散框架,用于高质量图像和视频重新照明和去照明。这项技术是对原始 DiffusionRenderer 的重大升级,通过改进的数据规划流程提高渲染质量。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🌟 该技术是对 NVIDIA 原始 DiffusionRenderer 的重大升级,可提供更高质量的图像和视频渲染。

💻 用户需要安装 Python3.10 和至少 16GB 的 NVIDIA GPU 内存,并创建相关的 conda 环境。

🎥 支持图像和视频的去光和重新光照,并可以使用各种环境光照贴图进行渲染。

更多详情:https://github.com/nv-tlabs/cosmos1-diffusion-renderer

10. 安卓开发革命!谷歌安卓工作室免费代理模式上线,超越苹果生态?

谷歌在 Google I/O 2025 上宣布推出 Android Studio 的免费代理模式。该模式基于Gemini 2.5 Pro,通过自然语言交互提高开发效率,支持跨文件任务、UI代码修改和自定义规则。它的功能不仅挑战了苹果的Xcode生态系统,还为开发者提供了更高效的工具。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🤖 代理模式:基于Gemini 2.5 Pro,通过自然语言交互完成复杂的开发任务。

🔍 核心功能:支持快速修改 UI 代码、自定义规则设置和百万令牌上下文窗口。

🚀 竞争优势:自由开放的 Agent 模式,直接挑战苹果的 Xcode 生态。

11. 谷歌开源结构化信息提取工具langextract,可以提供精准的源定位

谷歌开源了LangExtract工具,该工具可以高效地从非结构化文本中提取结构化信息,适用于医学、文学、商业等多个领域,为开发者提供了强大的解决方案。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🧠 准确的源溯源:提取的结果可以映射到源文本中的特定位置,方便验证和数据准确性溯源。

🧩 可靠的结构化输出:通过几个示例定义输出格式,确保符合用户预定义的 JSON 模式。

📊 交互式可视化:一键生成HTML报表,直观查看提取结果,提高审核效率。

更多详情:https://github.com/google/langextract

12. Figma 开发者模式重大更新:彩色标注与 MCP 协议双重升级,设计到代码效率飙升

Figma 最近对开发者模式进行了全面升级,引入了丰富多彩的交互式标注系统,并对模型上下文协议(MCP)进行了重大改进。这些更新显著提高了设计与开发协作的效率,为行业树立了新的标杆。

【🔥AI日报】混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布-Mo 动态

【AiBase提要:】

🎨 彩色交互式标注系统,让设计人员可以用不同的颜色标记信息,提高开发理解效率。

🔄 MCP协议升级支持结构化数据的传输,使得AI生成的代码更适合实际需求。

🚀 “开发就绪”视图等新功能简化了设计交接过程,提高了团队协作效率。

来源https://www.aibase.com/zh/