2025年5月份的AI重大资讯,看这篇就够了!
苹果推出 Matrix3D 模型,从少量 2D 照片生成 3D 场景,简化建模流程,推动 AI 技术发展。用户只需三张输入图像,该模型就能生成详细的 3D 重建,包括物体和整个环境,为沉浸式技术带来了实际应用潜力。
Qwen 团队推出 Deep Research 智能助理系统,可梳理复杂问题,生成研究报告,提升科研效率,免费开放体验。具体而言,Deep Research 可结合互联网上的海量信息,对复杂任务进行多步骤的搜索和分析总结,并以全面、易读的报告形式呈现研究结果。此外,该报告也大幅缩短了研究时间,过去数小时的任务如今仅需十几分钟。目前,Deep Research 已在 QwenChat 平台免费开放体验。
腾讯推出 CodeBuddy3.0 插件,与微信小程序开发工具深度整合,支持代码补全、智能提示等功能,提升开发效率。CodeBuddy 核心依托深度学习和自然语言处理(NLP)技术,结合腾讯自主研发的 DeepSeekR 和 HunYuan-TurboS 双模型,构建了高度智能化的代码理解与生成体系。其在算法优化方面实现了多项创新,例如支持多文件、跨项目的代码补全,能够根据上下文智能感知开发环境,提供精准的下一步建议。
在上海举办的火山引擎 FORCE LINK AI 创新巡展上,字节跳动正式发布最新的视觉语言多模态模型 Seed1.5-VL。Seed1.5-VL 的显著特点是其增强的多模态理解与推理能力。与之前的版本相比,Seed1.5-VL 在视觉定位和推理的速度与准确性上有了显著提升。此外,新增的视频理解和多模态智能体功能,使其在处理复杂任务时表现更加出色。
近日,阶跃星辰公司发布最新 3D 大模型 Step1X-3D,并宣布将此模型开源。这款模型拥有 4.8B 总参数量,其中,1.3B 专注于几何模块的精细构建,而 3.5B 则致力于纹理模块的生动呈现。Step1X-3D 通过创新的 3D 原生两阶段架构设计,实现了几何与纹理表征的巧妙解耦,从而确保了生成内容的结构稳固性和视觉逼真度。
日前,谷歌 AppiOS 版更新至 368.0 版本,其标志性四色「G」图标迎来小幅改版,色彩过渡加入渐变模糊效果,使颜色边界更柔和。此次更新还同步调整了备用图标,并与 Google Gemini 及 AI 界面视觉语言接轨,尽管引发不同评价,但暂未涉及 Google 主品牌标识或旗下其他产品图标调整。此次改动可能预示谷歌正构建更具统一性和未来感的视觉体系。
近日,有报道称苹果公司正在测试一项新功能,用户将能够利用 Vision Pro 头显的眼动追踪技术,轻松地滚动浏览应用程序。根据彭博社的科技马克·古尔曼(Mark Gurman)的消息,这一眼动滚动功能不仅适用于苹果自家的应用程序,未来还将开放给第三方开发者使用。
最近,谷歌官方确认将在 Windows10 和 Windows11 平台的 Chrome 浏览器中引入新功能——Gemini AI助手。这一消息源自于一份在谷歌反垄断审判中曝光的幻灯片,证实了早前的传言,标志着谷歌在人工智能集成上的进一步探索。
近日,上海市正式成立了“人工智能标识生态联盟”,这一新组织旨在推动人工智能领域的标识技术发展。该联盟由上海市委网信办指导,上海人工智能安全治理实验室牵头,汇聚了包括小红书、稀宇科技(MiniMax)在内的多家知名企业。这些成员单位的共同目标是提高人工智能生成内容的透明度和安全性,为构建可信的人工智能环境打下基础。
在最近发布的全球视频生成大模型榜单中,快手旗下的可灵 AI 2.0 模型以 1124 分的 Arena ELO 评分一举超越了其前任 1.6 版本,成功夺得全球冠军。这一消息引发了广泛关注,尤其是在 AI 技术日益崛起的背景下。可灵 AI 2.0 模型已经连续三个月稳居图生视频领域的顶端,显示出其强大的技术实力和市场潜力。
欢迎关注作者的微信公众号:「百度MEUX」