欢迎来到【 AI 日报】栏目! 这里是你每天探索人工智能世界的指南,每天我们为你呈现 AI 领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新 AI 产品应用。
新鲜 AI 热点点击了解: https://momodel.cn/news
1、腾讯元宝再升级:一句话搜索,图片视频即刻呈现,信息获取更直观!
腾讯元宝的升级功能让信息获取更加直观和高效,用户只需一句话提问即可获得图文并茂的回答,无论是学习新技能还是解决生活难题都变得更加简单。
【AiBase提要:】
🧠 一句话搜索,智能匹配图片和视频号内容
💡 学习新技能更直观,提供手把手教学体验
🔧 生活小问题也能轻松解决,化身生活小百科
2、微信支付MCP上线:AI与支付的完美结合,开启商业新纪元
微信支付MCP的推出为AI商业化带来了新的可能性,不仅拓宽了AI应用的盈利模式,还通过数据闭环提升了商业效率。
【AiBase提要:】
🧠 MCP功能为AI应用提供了新的盈利渠道,用户可直接通过支付完成服务获取。
📊 MCP构建了数据闭环,使商家能实时调整服务内容和价格以优化ROI。
📈 交易数据成为AI优化服务的来源,提升用户生命周期价值并创造更多盈利机会。
详情链接:https://yuanqi.tencent.com/mcp-shop
3、谷歌Veo3视频生成模型向 Pro / Ultra 会员开放,将新增“照片生成视频”功能
谷歌最新一代AI文生视频模型Veo3已向Google AI Pro和Ultra会员开放,凭借高清画质、音画同步能力和多模态创作功能,成为AI视频生成领域的焦点。其在影视制作、广告营销等领域展现出巨大潜力,并计划新增‘照片生成视频’功能。
【AiBase提要:】
🔥 Veo3支持生成1080p高清视频,内部测试可达4K分辨率,画面细节丰富且逼真。
🔊 首款支持视频与音频同步生成的模型,可自动生成环境音效、角色对白和背景音乐。
🎥 支持文字或图像输入生成视频,适用于复杂提示词指令和多镜头叙事,提升创作效率。
4、开源 DeepSeek R1增强版:推理效率提升200%,降低成本
文章详细介绍了DeepSeek-TNG-R1T2-Chimera的创新AoE架构及其在推理效率和性能上的突破,同时分析了MoE架构的优势及权重合并优化技术的应用。
【AiBase提要:】
🧠 AoE架构通过优化MoE模型,提升推理性能并节省token输出。
📊 Chimera版本在MTBench和AIME-2024测试中表现优于普通R1版本。
🔧 权重合并与优化技术显著降低模型复杂性和计算成本。
详情链接:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera
5、美图WHEE推出“一句话修图”功能
WHEE推出的“一句话修图”功能,让用户通过简单的语音指令即可完成复杂的修图操作,极大提升了用户体验。
【AiBase提要:】
🖼️ 通过简单的一句话,用户可以轻松实现修图效果,无需繁琐操作。
🖌️ 支持多种风格切换,如未来感、怀旧文艺范等,满足不同需求。
📝 可以添加或去除文字,精准处理照片中的文字内容。
6、芯片设计公司Ambiq Micro申请美国 IPO,受益于生成式AI推动的市场需求
Ambiq Micro 在2024年实现了16.1%的净销售额增长,尽管仍处于亏损状态,但其在超低功耗半导体领域的技术优势使其在边缘AI市场占据有利地位。公司计划通过IPO筹集资金用于产品开发和市场扩展,同时面临客户集中风险的问题。
【AiBase提要:】
🌟 Ambiq Micro 在 IPO 申请中报告2024年净销售额增长16.1%,达到7610万美元。
📉 尽管实现销售增长,但公司在2024年仍亏损3970万美元,面临客户集中风险。
🔌 公司专注于超低功耗半导体,目标是 “边缘 AI” 市场,满足对高效能芯片的需求。
7、昆仑万维再次开源奖励模型Skywork-Reward-V2
昆仑万维开源了第二代奖励模型Skywork-Reward-V2系列,涵盖8个不同参数规模的模型,在多个主流评测榜单中取得最优成绩。该系列基于高质量混合数据集构建,展现出强大的泛化能力和实用性。
【AiBase提要:】
✨ Skywork-Reward-V2系列包含8个模型,参数从6亿到80亿不等,全面超越当前最优水平。
🔍 构建了4000万对偏好对比的数据集,采用人机协同两阶段流程提升数据质量。
🚀 在多个评估基准上表现优异,尤其在通用偏好、正确性及高级能力测试中领先。
详情链接:https://huggingface.co/collections/Skywork/skywork-reward-v2-685cc86ce5d9c9e4be500c84
### 8、开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!**
Kyutai TTS的发布标志着开源AI语音技术迈入新阶段,其超低延迟、高精度语音输出及多语言支持为开发者提供了强大的工具,推动了语音交互技术的普及与创新。
【AiBase提要:】
🧠 Kyutai TTS支持文本流式传输,延迟低至350毫秒,显著提升实时语音交互体验。
🔊 语音生成精准度高,英语和法语的词错误率分别低至2.82和3.29,同时支持单词时间戳输出。
🌐 开源模式允许自由使用、修改和分发,推动全球AI社区创新与技术进步。
详情链接:https://kyutai.org/next/tts
9、Figma 拟以约200亿美元估值登陆纽交所,AI 设计未来可期
Figma拟以200亿美元估值登陆纽交所,凭借其财务稳健性、技术创新和市场扩展战略,展现了强大的增长潜力。
【AiBase提要:】
🚀 Figma计划以约200亿美元估值在纽交所上市,成为2025年备受瞩目的科技IPO之一。
📈 财务表现强劲,2024年收入达7.49亿美元,且拥有15.4亿美元现金储备。
🤖 Figma积极布局AI技术,推出Figma Make等工具,未来将整合生成式AI优化设计流程。
10.字节跳动开源 Trae-Agent,助力智能开发新体验
字节跳动开源 Trae-Agent,提升编程效率,支持多语言模型,提供强大开发工具。
【AiBase提要:】
🌟 多模型支持 :兼容 OpenAI 等多种语言模型,灵活适配开发需求。
🛠️ 功能集成 :内置文件编辑和脚本执行,支持复杂编程场景。
📝 日志记录 :自动保存操作日志,提升开发透明度与调试便利性。
产品链接:Trae-Agent GitHub
评论 (0)