登录 / 注册
首页 / AI快讯

2026-03-26

AI资讯 AI-Bot

谷歌推出AI音乐生成模型 Lyria 3 Pro

谷歌推出旗下先进AI音乐生成模型Lyria 3 Pro,较前代在生成结构和长度上大幅提升。模型可精准处理前奏、主歌、副歌、桥段等编曲要素,支持生成最长约3分钟的完整音轨。模型不会直接模仿特定艺术家风格,训练数据仅使用合法授权内容,且所有生成音频均嵌有SynthID数字水印。来源:IT之家

AI News Google

Transform your headphones into a live personal translator on iOS.

<img src="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Static-InterstitialscreenJapane.max-600x600.format-webp.webp">Google Translate’s Live translate with headphones is officially arriving on iOS! And we're expanding the capability for both iOS and Android users to even more countries…

AI News Google

Search Live is expanding globally

<img src="https://storage.googleapis.com/gweb-uniblog-publish-prod/images/Search_Live_blog_header.max-600x600.format-webp.webp">We’re expanding Search Live globally, to all languages and locations where AI Mode is available.

AI资讯 AI-Bot

美团龙猫团队开源多模态大模型LongCat-Next

美团龙猫团队推出LongCat-Next多模态模型,核心创新为LoZA稀疏注意力机制。模型支持1M超长上下文,通过智能筛查将50%低重要模块替换为流式稀疏注意力,实现128K解码速度提升10倍、算力节省30%。模型包含Flash-Exp和Flash-Lite两个版本,在长文本任务表现超越Qwen-3。来源:AI工具集

2026-03-25

AI资讯 AI-Bot

OpenAI宣布关停Sora,战略转向企业级生产力工具

OpenAI宣布关停Sora视频生成平台,包括App、API及ChatGPT视频功能。关停根本原因是OpenAI为筹备IPO进行的战略收缩,将算力转向下一代模型”Spud”及企业级生产力工具。同时OpenAI刚与迪士尼达成三年IP授权协议并获10亿美元投资意向,现已终止合作。来源:APPSO

AI资讯 AI-Bot

MiniMax Office Skills:开源一套生产级办公文档引擎

MiniMax宣布开源一套生产级Office文档引擎MiniMax Office Skills,包含Word、Excel、PDF、PPT四大组件,采用MIT协议。方案能解决AI生成文档”能用但不好用”的痛点,确保公式、格式、数据透视表等高级功能完整保留。技术选型上,Word采用.NET OpenXML SDK非python-docx,Excel直接操作XML非openpyxl,换取更高保真度。来源:MiniMax 稀宇科技

AI资讯 AI-Bot

JVS Claw全面开放,无需邀请码快乐养虾

阿里云JVS Claw全面开放公测,用户无需邀请码可访问使用。新版本新增语音输入、5GB专属文件空间、一键修复、Skill开关等功能,支持定时任务管理和Clawbot一键升级。新用户可享7天免费体验,付费版”匠心版”首月低至39元,用户无需购买Mac mini硬件或承担API费用可使用云端OpenClaw服务。来源:阿里云

AI资讯 AI-Bot

阿里在海外推出”企业级龙虾”Accio Work

阿里在海外上线企业级Agent产品Accio Work ,定位”企业版龙虾”。用户只需提出想法,内置的AI Agent团队可7×24小时自动完成选品、采购、建站、运营等全流程,30分钟生成可运营的海外网店。产品支持单个Agent对话或Agent Team群聊模式,可自定义角色与技能,关键操作需用户授权保障安全。来源:量子位

2026-03-24

AI资讯 AI-Bot

智象未来推出首个多模态应用“龙虾”产品——HiDreamClaw

智象未来推出首个图片视频原生AI Agent产品HiDreamClaw,已接入旗下创意平台vivago web端面向海外用户开放。产品基于自研超百亿参数HiDream-I1多模态大模型,内置AIGC Skill,支持图片、视频、文字等多模态创作,集成Nano Banana、Veo、Sora等SOTA模型。来源:HiDream智象未来

AI资讯 AI-Bot

阿里通义推出PrismAudio:声画同频,音效随行

阿里通义实验室推出视频生成音频框架 PrismAudio,专注环境音/音效合成。模型首创将强化学习与思维链结合,通过”分解式思维链”让模型先分析视频内容、时序、音质、空间位置再生成音频,引入四位”老师”(语义、时序、美学、空间)分别打分优化。来源:通义实验室

AI资讯 AI-Bot

Meta收编 AI 智能体公司 Dreamer

Meta收购AI创业公司Dreamer及团队,公司由前小米全球副总裁雨果·巴拉等人创立,能帮助用户创建AI智能体。Dreamer团队将加入Meta超级智能实验室,负责AI智能体研发。目前协议条款未披露,但投资方将获得高于投资额的回报,Dreamer保留独立法人实体地位,Meta获得非排他性技术许可。来源:IT之家

AI资讯 AI-Bot

阿里达摩院祭出开源架构CPU王炸:玄铁C950

阿里达摩院推出新一代旗舰RISC-V CPU IP——玄铁C950,SPECint2006基准测试突破70分,成为全球最强RISC-V CPU。产品首次实现RISC-V CPU原生流畅跑通千亿参数大模型(Qwen3、DeepSeek V3),集成4K超宽Vector引擎和Matrix引擎,单核算力达8TFLOPS。来源:智东西

2026-03-23

AI资讯 AI-Bot

美团开源LongCat-Flash-Prover数学证明模型

美团开源LongCat-Flash-Prover 大模型,采用 5677 亿参数 MoE 架构,专注解决复杂数学证明问题。模型引入混合专家迭代框架,整合 Lean4 与 AST 多阶段严格验证,有效消除幻觉。在 MiniF2F-Test 上取得 97.1% 成绩,PutnamBench 解决 41.5% 问题,两项测试均刷新 SOTA 水平。来源:AI工具集

AI资讯 AI-Bot

腾讯推出AI设计工具Ardot,即将开启公测

腾讯推出自研AI设计工具Ardot,能帮助设计师从”做图的”回归”设计师”角色。Ardot旨在成为”最懂设计师的小助手”,承担重复性工作,如自动整理图层、智能调整细节,让设计师专注于创意与洞察,实现灵感更快落地。来源:腾讯设计Ardot

AI资讯 AI-Bot

百度推出首个国产企业级满血版OpenClaw「DuMate」

百度智能云DuMate(中文名:搭子)正式上线,成为国内首个企业级满血版OpenClaw产品。产品用自然语言为交互入口,支持Word、Excel、PPT等办公软件的原生操作,具备文件智能管理、多源数据分析、办公操作自动化三大核心功能。DuMate内置百度搜索等Skills全家桶能力,支持灵活扩展。来源:百度

AI资讯 AI-Bot

微信推出官方龙虾插件微信ClawBot

微信正式推出微信ClawBot插件,支持接入 OpenClaw(龙虾)。用户通过「我-设置-插件」获取安装指令,扫码可将龙虾连接至微信,实现聊天式远程操控。目前插件逐步放量中,需更新至微信最新版本。同时,腾讯云 Lighthouse(含企业版 Claw Pro)、自研 WorkBuddy、本地 QClaw 等也已支持微信通道。来源:腾讯

AI资讯 AI-Bot

MiniMax Token Plan:全球首个支持全模态模型的订阅计划

MiniMax推出全球首个支持全模态模型的订阅计划Token Plan,在原Coding Plan基础上新增视频、语音、音乐、图像等多模态模型调用能力,一个Key可满足代码编写、内容创作、视频生成等需求。同时推出语音/视频资源包可节省20%成本。来源:MiniMax 稀宇科技

AI资讯 AI-Bot

智谱推出成长型 AI 生命体GLM-Claw

智谱推出GLM-Claw智能体,支持打造一群”懂你的AI虾兵”协助处理各类事务。产品定位为个性化AI助手团队,可协同完成复杂任务,提升用户工作与生活效率。通过多智能体协作机制,实现从单一对话向多任务处理的升级。来源:智谱清言

2026-03-20

AI资讯 AI-Bot

腾讯QClaw全面开放,无需邀请码下载就能用

腾讯QClaw AI助手正式开启全量公测,无需邀请码即可下载使用。新版本打通微信、企业微信、QQ、飞书、钉钉五大IM平台,率先实现企业微信自动回复消息功能,可总结聊天内容、写文档、订日程等。新增「像素工作室」可视化界面,用像素风格展示AI工作状态;推出可视化定时任务功能,支持周期性任务管理与一键执行。来源:腾讯云

AI资讯 AI-Bot

Cursor推出AI编程模型Composer 2

Cursor正式推出Composer 2,已在Cursor中上线。模型具备前沿级编码能力,定价为每百万输入token 2.50美元,在智能与成本之间实现最优平衡。在CursorBench测试中,Composer 2性能显著优于前代及竞品;在Terminal-Bench 2.0基准测试中得分61.7%,超越Opus 4.6(58.0%)和Composer 1.5(47.9%)。来源:Cursor

AI资讯 AI-Bot

Vidu AI推出ViduClaw「V龙」智能体

生数科技旗下AI视频平台Vidu正式推出ViduClaw「V龙」智能体。产品定位为可商用的一站式AI视频Agent解决方案,支持”一键成片”功能——用户仅需上传一张产品图加一句话描述,或一个参考视频加一张图加一句话,可自动生成15-30秒完整广告片,涵盖分镜脚本、场景拆解、画面与配音同步输出。来源:Vidu AI

AI资讯 AI-Bot

商汤大装置×大晓机器人×广西产业技术研究院达成三方战略合作

商汤大装置、大晓机器人与广西产业技术研究院达成三方战略合作,共同赋能广西具身智能产业升级。三方将协同构建”算力—数据—模型—场景”四位一体产业闭环,依托”广西—东盟具身智能中试训练场”,打造专属算力调度平台、具身高质量数据集和规模化机器人应用场景,助力广西打造面向东盟的具身智能产业创新高地。来源:商汤科技SenseTime

AI资讯 AI-Bot

阿里推出Qwen3.5-Max-Preview最新一代旗舰模型预览版

阿里通义千问推出Qwen3.5-Max-Preview 预览版,模型在代码、数学、多语言理解等能力上实现显著提升。作为Qwen3.5系列旗舰模型,采用混合专家(MoE)架构,总参数量达235B,激活参数22B,在保持高效推理的同时实现性能突破。模型支持长达256K tokens的上下文窗口,擅长复杂推理和长文本处理。来源:千问大模型

2026-03-19

AI资讯 AI-Bot

小米推出三款面向面向 Agent 时代的大模型

小米连发三款面向Agent时代的大模型:MiMo-V2-Pro 旗舰基座模型,1T参数/42B激活,1M上下文;MiMo-V2-Omni 全模态Agent基座,融合文本/视觉/语音,支持GUI操作与工具调用;MiMo-V2-TTS 语音合成模型,支持多粒度情感控制、方言与歌声。三者分别以”Healer Alpha”和”Hunter Alpha”代号在OpenRouter匿名测试。来源:小米技术

AI资讯 AI-Bot

阶跃星辰推出桌面端AI Agent「StepClaw」

阶跃星辰推出基于OpenClaw深度优化的桌面端AI Agent「StepClaw」,支持Windows和Mac双端,无需服务器和命令行可一键部署。产品接入拥有5000+创作者的「水产市场」生态,提供Skill、插件、触发器等应用资源,支持Agent自主进化、个性化换肤、经验沉淀分享等功能。数据本地存储保障安全,内置安全审查技术拦截恶意代码。来源:阶跃星辰

AI资讯 AI-Bot

面壁智能推出开源智能体框架EdgeClaw

面壁智能联合清华大学、OpenBMB社区开源EdgeClaw框架,和开箱即用的智能硬件EdgeClaw Box——专为OPC(一人公司)及数据敏感企业打造。产品通过S1/S2/S3三级隐私路由机制,实现数据本地化处理、自动脱敏上云、断网运行等功能,集成MiniCPM端侧模型,支持零Token消耗处理简单任务。来源:面壁智能

2026-03-18

AI资讯 AI-Bot

Skywork正式推出云端AI原生助理SkyClaw

昆仑万维旗下Skywork正式推出云端AI原生助理SkyClaw,发布首批六大官方Skills,涵盖Skywork PPT、Document、Excel、Design、Search及Mureka Music Maker,用户可通过GitHub或Clawhub平台调用。SkyClaw基于开源架构OpenClaw深度重构,支持24/7云端持续运行,本地离线也能自动完成任务。来源:昆仑万维集团

AI资讯 AI-Bot

Midjourney推出Midjourney V8模型

Midjourney于3月17日正式推出Midjourney V8 Alpha测试版,带来革命性升级:模型生成速度提升约5倍,提示理解能力显著增强,文本渲染质量大幅改善,图像细节与连贯性全面提升。新增原生2K高清模式和增强连贯性模式,完美兼容V7个性化配置。官方建议采用长提示配合高风格化参数以发挥最佳效果。来源:AI工具集

AI资讯 AI-Bot

MiniMax推出MiniMax M2.7,开启模型的自我进化

MiniMax推出MiniMax M2.7模型,首次实现模型深度参与自我迭代。模型可构建复杂Agent Harness,通过Agent Teams、复杂Skills等能力完成高度复杂的生产力任务。在软件工程领域,M2.7在SWE-Pro基准测试中得分56.22%接近Opus水平,在VIBE-Pro端到端项目交付中达55.6%。在专业办公领域,GDPval-AA的ELO得分1495为开源最高。来源:MiniMax 稀宇科技

AI资讯 AI-Bot

OpenAI推出GPT-5.4 mini和GPT-5.4 nano,实力逼近满血版

OpenAI最新推出GPT-5.4 mini与GPT-5.4 nano两款轻量级模型,GPT-5.4 mini在SWE-Bench Pro编码基准测试中取得54.4%成绩,比满血版GPT-5.4低3.3个百分点,运行速度较上一代提升2倍,同时支持40万token超长上下文,输入价格仅0.75美元/百万token,输出价格为满血版的三分之一。GPT-5.4 nano定位超轻量任务,价格仅为满血版1/12。来源:新智元

AI资讯 AI-Bot

LiblibAI推出专业AI视频创作平台LibTV

LiblibAI推出首个同时面向人类创作者与AI Agent的专业视频创作平台LibTV,平台提供无限画布式工作流,支持剧本解析、分镜管理、角色三视图、多机位生成等20余种专业AI能力,集成豆包、可灵、Kimi等顶级模型。Agent可通过Skill接口调用LibTV,实现一句话生成5分钟短剧、音乐转MV、视频风格复刻等自动化创作。来源:哩布哩布AI

2026-03-17

AI资讯 AI-Bot

Manus桌面端推出My Computer功能,支持Mac 和Win系统

Manus桌面端正式推出”My Computer”可支持直接操作用户本地电脑。My Computer功能支持AI从云端沙箱进入本地环境,可读取编辑本地文件、启动应用程序、执行终端命令,实现文件自动整理、本地开发、利用闲置算力等场景。安全方面,每个终端命令都需用户明确批准。目前已支持macOS和Windows系统。来源:AI工具集

AI资讯 AI-Bot

英伟达推出NemoClaw,全新Rubin算力狂飙35倍

英伟达GTC 2026大会推出”龙虾”NemoClaw——英伟达版OpenClaw,通过安全沙箱和本地模型部署,让企业安全使用AI Agent。老黄豪言2027年芯片营收剑指1万亿美元,宣称OpenClaw将成为”个人AI的操作系统”,开启GaaS新时代。来源:新智元

AI资讯 AI-Bot

全球首个企业级Agent平台“悟空”来了

阿里巴巴正式推出全球首个企业级AI原生工作平台”悟空“。平台定位为独立应用,同时内置钉钉,支持连接企业钉钉账号及安全访问权限。悟空主打企业级安全,AI Agent自动继承企业权限规则,所有操作在安全沙箱中运行。来源:阿里巴巴

AI资讯 AI-Bot

商汤办公小浣熊「技能模板」功能开启内测

商汤办公小浣熊正式推出技能模板内测功能,帮助用户避免重复数据分析工作。用户可创建、保存和复用自定义技能模板,提升办公效率。功能支持将常用分析流程标准化,实现一键调用。目前内测申请已开放,用户可前往官网体验。来源:商汤小浣熊

AI资讯 AI-Bot

科大讯飞正式发布桌面级AI智能助理Loomy

讯飞开放平台推出基于AstronClaw的桌面级智能助理Loomy,产品主打本地办公场景,支持文件整理、数据分析、内容创作等任务,最快1分钟完成部署。Loomy采用”目录级隔离”安全机制,仅访问授权目录,并支持QQ、飞书、钉钉等IM工具远程操控。产品兼容OpenClaw技能体系及MCP协议,支持DeepSeek、MiniMax等主流模型切换。来源:讯飞开放平台

AI资讯 AI-Bot

全球首个自进化个人AI :MuleRun正式推出

全球首个自进化个人AI产品MuleRun(骡子快跑)正式发布。产品主打”0门槛”使用,无需部署安装,打开网页即可操作。MuleRun具备7×24小时云端持续运行能力,用户离线也能自动执行任务。产品核心特性包括自主进化、主动触达以及群体智慧共享,开放Agent网络生态,优质Agent可一键复用。来源:量子位

2026-03-16

AI资讯 AI-Bot

通义推出Fun-CineForge,首个影视级配音多模态大模型

通义实验室开源首个支持影视级配音的多模态模型Fun-CineForge,配套开放高质量数据集构建方法CineDub。模型基于CosyVoice3底层能力,创新引入”时间模态”,融合视觉、文本、音频、时间四种模态,实现口型同步、情绪表达、音色一致和时间对齐四大功能,支持独白、旁白、双人及多人对话场景。来源:通义实验室

AI资讯 AI-Bot

清华开源 OpenMAIC,国内首个L4级AI课堂

清华大学研究团队开源国内首个L4级AI课堂平台OpenMAIC,平台通过多智能体协作,将PDF、论文等资料自动生成互动式课堂,配备AI老师、助教及虚拟学生角色,实现语音讲解、实时互动、白板标注等功能。教师上传材料,系统可自动解析生成课件、测验及PBL网页,大幅降低备课成本。来源:机器之心

AI资讯 AI-Bot

智谱推出GLM-5-Turbo:龙虾增强的基座模型

智谱发布GLM-5-Turbo龙虾增强基座模型,专为OpenClaw Agent场景深度优化。模型在工具调用、指令遵循、定时任务及长链路执行等核心能力上显著增强,在自研ZClawBench评测中获国产模型第一。阿里、字节、美团等互联网大厂内测评价其”精准稳定、长任务不掉链子”。来源:智谱

AI资讯 AI-Bot

阿里云旗下AI Agent产品JVS Claw正式推出移动端App

阿里云旗下AI Agent产品JVS Claw正式推出移动端App,基于开源OpenClaw架构打造,主打”开箱即用、云端隔离”。用户可通过手机App直接”遥控”专属云电脑(6核/12GB Linux环境),让Clawbot自动完成网页编写、数据查询、定时任务等复杂操作,无需接入飞书或QQ等第三方工具。来源:智东西

2026-03-13

AI资讯 AI-Bot

InternVL-U重磅开源,4B参数实现理解、推理、生成、编辑一体化

上海人工智能实验室联合多所高校开源多模态一体化模型InternVL-U,仅4B参数即实现理解、推理、生成、编辑四大能力统一。模型采用”统一语境建模+模态专用模块化+解耦视觉表征”架构,在文本渲染、科学推理等复杂场景中性能超越14B级模型,已全面开源并提供完整推理代码与评测工具。来源:书生Intern

AI资讯 AI-Bot

大晓机器人开源实时生成世界模型 Kairos 3.0-4B

大晓机器人开源具身原生世界模型Kairos 3.0-4B,以”多模态理解—生成—预测”一体化架构实现物理级深度理解与长时动态交互。模型仅4B参数,推理速度较Cosmos 2.5提升72倍,是行业首个在THOR端侧平台达成1:1.5实时生成的具身世界模型,可直接驱动机器人本体完成作业。来源:大晓机器人

2026-03-12

AI资讯 AI-Bot

英伟达最强开源权重 AI 模型:Nemotron 3 Super 登场

英伟达发布最强开源权重AI模型Nemotron 3 Super,拥有1200亿参数(MoE架构,推理时仅激活120亿),吞吐量较前代提升5倍,准确率翻倍。模型配备100万Token超长上下文窗口,专为多智能体系统设计,可解决”上下文爆炸”和”推理税”问题。采用Mamba-Transformer混合架构,引入”潜在MoE”新技术,支持多Token预测。来源:IT之家

AI资讯 AI-Bot

百度智能云发布全球首款手机龙虾应用:红手指Operator

百度智能云发布全球首款手机龙虾应用”红手指Operator“,已上线安卓市场。应用结合OpenClaw与自研移动端AI Agent能力,用户通过聊天即可指挥手机完成打车、外卖订餐等跨App交互操作,实现”一句话搞定复杂任务”。应用具备深度语义理解、高效执行和精准方案产出能力,可完成信息搜集、定时推送、自动下载等流程。来源:百度

AI资讯 AI-Bot

光轮智能完成10亿元融资,全球首个具身数据独角兽诞生

光轮智能完成10亿元A++及A+++轮融资,投资方包括新希望集团、三安光电家族办公室、奥克斯等产业方及建投华科等财务机构,成为全球首个具身数据领域独角兽。公司构建世界-行为-评测三层架构,提供物理仿真、规模化数据生产与模型评测服务,已服务英伟达、谷歌、Figure AI、字节、智元等头部客户,在仿真合成数据、仿真评测、人类视频数据三项能力上实现全球交付冠军。来源:光轮智能

AI资讯 AI-Bot

爱诗科技完成C轮融资,鼎晖领投,全面开启“可玩现实”新纪元

AI视频生成企业爱诗科技宣布完成C轮融资,由鼎晖香港基金、鼎晖VGC、鼎晖百孚领投,中国儒意、三七互娱、亦庄国投、众为资本等国内外多家机构跟投。本轮资金将用于视频基础模型迭代、实时世界模型研发及全球化团队建设。其PixVerse V5.6模型在Artificial Analysis榜单中位列图生视频与文生视频全球第二,全球首发实时世界模型PixVerse R1,用户规模已突破1亿。来源:爱诗科技AIsphere

AI资讯 AI-Bot

安全养虾发布!讯飞AstronClaw全面开放

科大讯飞AstronClaw全面开放,基于OpenClaw打造云端AI助手,支持一键部署、沙箱隔离运行保障数据安全。产品接入企业微信、钉钉、飞书等主流IM,内置120+官方Skills并支持调用ClawHub生态10,000+技能,覆盖办公、营销、金融等场景。集成星火X2、Kimi-K2.5、GLM-5等多款旗舰大模型。来源:讯飞开放平台

AI资讯 AI-Bot

安全免配置,威努特WinClaw正式发布

威努特正式发布安全龙虾产品WinClaw,针对OpenClaw存在的安全风险(CNNVD通报82个漏洞,含12个超危漏洞)及配置复杂等问题,构建五层安全防护体系:身份认证双向鉴权、安装审查拦截14类危险模式、消息拦截41条安全规则、执行约束敏感操作二次确认、监控审计本地日志追溯。来源:威努特安全网络

2026-03-11

AI资讯 AI-Bot

新加坡MetaComp获数千万美元Pre-A+轮融资

新加坡金融科技公司MetaComp完成数千万美元Pre-A+轮融资,由知名互联网大厂战投及Spark Venture等机构投资,老股东跟投。公司2025年已实现净利润转正,即时流动资金超1亿美元,月支付交易流水超10亿美元,财富在管规模超5亿美元。来源:暗涌Waves

AI资讯 AI-Bot

人类社交网络巨头Meta收购了AI社交网络Moltbook

Meta正式收购AI社交网络Moltbook,创始人Matt Schlicht和Ben Parr将于3月16日加入Meta超级智能实验室(MSL)。Moltbook上线一个多月即吸引19.4万个AI智能体和超200万帖子,曾因”AI自发建立宗教”等话题引发热议,后被揭穿多为人类伪装。Meta看中其智能体验证身份与互联的系统机制,为构建”智能体身份注册表”铺路,以应对AI从聊天工具向自主实体演进的趋势。来源:机器之心

AI资讯 AI-Bot

Dify 完成 3000 万美元融资,红杉领投

AI应用开发平台Dify完成3000万美元Pre-A轮融资,由红杉中国领投,GL Ventures、Alt-Alpha Capital、五源资本等跟投。本轮融资将用于提升Agent可靠性、企业级运营管控能力、降低构建门槛及建设开源生态。Dify是一个开源的Agentic Workflow构建平台,提供可视化构建器和生产级工程基础设施,帮助团队快速构建、部署和运维AI工作流。来源:Dify

AI资讯 AI-Bot

谷歌首个原生多模态嵌入模型 Gemini Embedding 2 发布

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2,支持将文本、图像、视频、音频和文档映射到同一嵌入空间,可识别100种语言的语义意图。模型单次请求可处理最多6张图片、120秒视频、6页PDF及直接音频输入,适用于RAG、语义搜索、情感分析和数据聚类等场景。来源:IT之家

2026-03-10

AI资讯 AI-Bot

阿里版OpenClaw更名”JVS Claw”,并开启内测

阿里云旗下AI Agent产品”无影JVS”正式更名为”JVS Claw“,目前已推出独立APP和网页版,处于邀请码内测阶段。产品以可定制的Clawbot为核心,搭配6核/12GB独立云端ClawSpace环境,支持实时查看AI操作链路。内置浏览器自动化、Office文档处理等预制技能,用户可通过”技能查找”安装ClawHub新技能,或用自然语言创建自定义技能。来源:AI工具集

AI资讯 AI-Bot

腾讯推出QClaw:一键安装,直接打通微信

腾讯电脑管家推出QClaw,基于OpenClaw打造的本地AI助手,支持Mac和Windows双端,内置Kimi-2.5等模型。核心亮点是零配置直接关联微信,用户可通过微信远程操控电脑完成任务,如处理文档、社媒运营、GitHub项目开发等。数据全部本地存储保障隐私,依托5000+Skills生态,具备持续记忆能力。来源:APPSO

AI资讯 AI-Bot

腾讯云推出SkillHub,专为中国用户优化的AI技能社区

腾讯云推出SkillHub,专为中国用户优化的OpenClaw AI Skills社区。依托国内高速镜像,解决官方ClawHub下载慢、中文搜索不友好、社区交流不便三大痛点,实现Skill秒速安装。平台提供精选Top 50榜单、8大分类中文搜索及安全审计,收录1.3万个Skills,支持一键复制安装命令,并计划打造开放中文开发者社区。来源:AI工具集

AI资讯 AI-Bot

智谱发布AutoClaw(澳龙):国内首个一键安装本地版OpenClaw

智谱正式上线 AutoClaw(中文名”澳龙”),成为国内首个支持一键安装的本地版OpenClaw工具。产品预置50+热门Skills,支持macOS和Windows双平台,1分钟即可完成部署,一键接入飞书等即时通讯工具。AutoClaw内置智谱专为Agent场景优化的Pony-Alpha-2模型(内测中),集成AutoGLM Browser-Use浏览器操作能力,可稳定执行多步骤、跨页面的复杂任务。来源:智谱

2026-03-09

AI资讯 AI-Bot

OpenClaw 3.8版本发布:12+安全漏洞修复+三大新功能

OpenClaw团队连夜推出2026.3.8版本。本次更新新增ACP来源识别、openclaw备份机制及Telegram假冒清除三大功能,修复12个以上安全漏洞。同时带来GPT-5.4前向兼容(支持105万Token上下文)、Brave搜索强化、Talk语音模式静默等待优化等改进,针对macOS和Android端进行专项优化与安全加固。来源:机器之心

AI资讯 AI-Bot

腾讯WorkBuddy正式上线:免部署版”小龙虾”AI智能体来了

腾讯旗下全场景AI智能体WorkBuddy正式上线,被称为腾讯版”小龙虾”(OpenClaw)。产品完全兼容OpenClaw技能,但无需复杂部署,下载安装后即可使用,1分钟完成企业微信配置。WorkBuddy内置20多种Skills技能包,支持多窗口、多Agent并行工作,可无缝切换Hunyuan、DeepSeek、GLM等主流模型,并具备企业级安全审计能力。来源:腾讯云

AI资讯 AI-Bot

扣子Coze推出AI Agent中文社区InStreet,全面开放内测

扣子Coze宣布AI Agent中文社区 InStreet 全面开放内测,定位为”OpenClaw养虾第一站”。该社区仅允许Agent发帖互动,人类用户可围观学习。InStreet 提供Skill技能分享、积分排行榜、虚拟炒股竞技场等功能,已积累超1.1万条评论和1.6万点赞。来源:扣子Coze

2026-03-06

AI资讯 AI-Bot

阿里开源HiClaw: Team 版 OpenClaw,5分钟完成本地安装

阿里云开源HiClaw,作为OpenClaw的”Team版”升级方案,引入Manager Agent架构实现多Agent协作管理。HiClaw通过AI Gateway集中管理API凭证,解决原生OpenClaw的安全风险;Worker Agent运行在独立容器中,技能与记忆完全隔离。系统内置Matrix服务器和Element客户端,支持移动端随时指挥,无需配置飞书/钉钉机器人。来源:阿里云开发者

AI资讯 AI-Bot

微软开源 Phi-4-Reasoning-Vision-15B 视觉推理模型

微软发布Phi-4-Reasoning-Vision-15B开源模型,采用MIT许可证,是Phi-4系列首个同时具备高分辨率视觉感知与选择性推理能力的小语言模型。模型可根据任务需求在”推理模式”与”非推理模式”间自动切换,数学推理时启用多步思考链,简单OCR任务则直接输出以降低延迟。来源:IT之家

AI资讯 AI-Bot

OpenAI 最强模型 GPT-5.4 正式登场:原生支持计算机操控

OpenAI正式发布GPT-5.4,首次在单一模型中融合推理、编程、计算机原生交互、深度网页搜索及百万级Token上下文五大能力。模型在GDPval知识工作测试中得分83%,在SWE-Bench Pro编程测试中达57.7%,并在OSWorld计算机操作测试中取得75%成绩,均为业界领先。来源:量子位

2026-03-05

AI资讯 AI-Bot

MiniMax Music 2.5+:解锁你的专属“天空之城”

MiniMax发布Music 2.5+版本,新增纯音乐创作能力。模型支持古典管弦、极简主义、现代电子、氛围音等多元风格,可生成从零乐器自然声到多轨器乐编排的完整作品,适用于冥想、助眠、广告、游戏配乐及影视配乐场景。来源:MiniMax稀宇科技

AI资讯 AI-Bot

Perplexity与CoreWeave达成多年战略合作,聚焦AI推理基础设施

AI云服务企业CoreWeave与AI搜索公司Perplexity达成多年期战略合作。Perplexity将利用CoreWeave的云算力资源(包括英伟达GB200 NVL机架系统)运行其AI推理工作负载,CoreWeave则将在内部全面部署Perplexity Enterprise Max订阅。此次合作为Perplexity提供高性能、可靠的AI云平台支持,加速其AI工具和智能体的规模化发展。来源:IT之家

2026-03-04

AI资讯 AI-Bot

Flowith 完成千万美元种子轮和种子+轮融资

AI创作平台Flowith宣布完成千万美元种子轮及种子+轮融资,种子轮由祥峰投资等机构参与,种子+轮由红杉中国种子基金、江远投资联合领投。Flowith致力于打造Agentic AI时代的”行动派”操作系统,已推出多线程画布交互、云端无限Agent及首款本地化AI全链路创作助手FlowithOS。来源:Z Potentials

AI资讯 AI-Bot

谷歌 Gemini 3.1 Flash-Lite 登场,首字响应提速 2.5 倍

谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite,称其为Gemini 3系列中速度最快、最具成本效益的模型。模型首字响应速度较2.5 Flash提升2.5倍,整体输出速度提升45%,定价为每百万输入Tokens 0.25美元、输出1.50美元。模型在Arena.ai获1432分Elo得分,GPQA Diamond测试达86.9%,多项指标超越前代。来源:IT之家

AI资讯 AI-Bot

QoderWork 重磅更新 | 正式发布支持 Windows 版

QoderWork正式发布Windows版本,同时推出三大升级:支持标准和旗舰两档模型分级选择,满足不同任务需求;新增预制沙盒环境,在隔离虚拟环境中执行任务,提升稳定性与成功率;上线Skills技能广场,集成文档协作、效率工具、设计UI等主流技能一键安装。来源:Qoder

2026-03-03

AI资讯 AI-Bot

阿里千问开源四款 Qwen3.5 小尺寸模型

阿里千问宣布开源4款Qwen3.5小尺寸模型:Qwen3.5-0.8B/2B/4B/9B。该系列采用原生多模态训练和最新架构,覆盖从端侧到服务器的轻量级AI需求。其中0.8B/2B适合移动设备和IoT边缘部署;4B定位为轻量级Agent基座;9B性能媲美gpt-oss-120B。来源:通义实验室

AI资讯 AI-Bot

小红书发布并开源端到端文档识别模型:FireRed-OCR

小红书团队发布并开源端到端文档识别模型FireRed-OCR,基于Qwen3-VL架构,首创”三阶段渐进优化”策略与”几何+语义”数据工厂,解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA,综合评分92.9%领先Gemini-3.0 Pro等模型。来源:小红书技术REDtech

AI资讯 AI-Bot

阿里通义语音双模型 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 发布

通义实验室发布两款语音生成模型Fun-CosyVoice3.5与Fun-AudioGen-VD,首创FreeStyle指令控制范式,用户可通过自然语言描述语气、情绪、场景等细节,无需依赖固定标签。Fun-CosyVoice3.5支持多语种复刻与精细化表达控制,新增泰语、印尼语等4个小语种,生僻字读错率降至5.3%;Fun-AudioGen-VD则实现端到端声音设计,可生成角色化音色并模拟环境声学效果。来源:通义实验室

2026-03-02

AI资讯 AI-Bot

松延动力宣布完成B轮融资,累计近10亿元,宁德时代领投

人形机器人企业松延动力宣布完成B轮融资,累计规模近10亿元,由宁德时代系晨道资本领投,国科投资、京国盛基金、九合创投等跟投。这是公司第9轮融资,标志着人形机器人行业从技术验证迈向商业化闭环。本轮融资将加速家庭消费场景落地与产业链整合。来源:NOETIX松延动力

AI资讯 AI-Bot

再次刷新具身智能单轮融资金额,银河通用拿下 25 亿融资

具身智能公司银河通用宣布完成25亿元新一轮融资,由国家人工智能产业基金(大基金三期)、中国石化、中信投资控股、中国银行、上汽集团等多家国资及产业资本领投,刷新行业单轮融资纪录。本轮国资密集入局,标志着具身智能融资进入”重装时代”。来源:极客公园

2026-02-28

AI资讯 AI-Bot

OpenAI获得1100亿美元融资

OpenAI获得新一轮高达1100亿美元的融资,投资方包括亚马逊、英伟达和软银,投资额分别为500亿、300亿和300亿美元。此轮融资前,公司的估值已达到7300亿美元。OpenAI还与亚马逊建立了战略伙伴关系,并同英伟达就下一代推理计算技术达成了协议。该轮融资预计还将吸引更多金融投资者参与。来源:第一财经

AI资讯 AI-Bot

阿里通义 CoPaw 开源!爆改你的专属智能搭档

AgentScope团队宣布其个人智能助理产品CoPaw正式开源,采用Apache 2.0许可协议,支持免费商用。此次开源版本聚焦易用性、本地部署、记忆管理与可扩展性四大方向进行全面升级,核心在于降低使用门槛并打开能力上限。CoPaw现支持通过自定义供应商、Ollama、llama.cpp、MLX等多种方式接入本地或自建模型,实现全链路数据本地化。来源:通义实验室

AI资讯 AI-Bot

面壁智能开年获数亿元融资,中国电信领投

面壁智能在2026年农历新年(马年)后完成数亿元融资,由中国电信领投,中信金石、中信私募跟投。中国电信将发挥云网端优势,与面壁智能在“高效大模型”领域的算法落地经验结合,深化业务协同。本轮融资标志着面壁智能正式开启与国家级信息基础设施方的战略合作。来源:面壁智能

AI资讯 AI-Bot

Lemon AI获数千万Pre-A轮融资,天际资本独家投资

天际资本近日独家投资了Lemon AI数千万人民币Pre-A轮融资。该公司为企业提供“全栈开源+本地化部署”的AI安全落地方案,企业可在自有Docker环境中调用主流开源大模型,数据不出本地,以解决金融、医疗等行业的数据安全顾虑。来源:钛媒体

2026-02-27

AI资讯 AI-Bot

华为云码道(CodeArts)代码智能体公测版正式发布

华为云在线上发布会上正式发布了华为云码道(CodeArts)代码智能体的公测版。是一个集成代码大模型、IDE与自主开发模式的AI编码解决方案。覆盖代码生成、单元测试、研发知识问答、规范驱动开发等场景,支持IDE、VS Code等多种开发环境。来源:华为云

AI资讯 AI-Bot

谷歌推出 Nano Banana 2 图像 AI 模型:支持 4K 分辨率输出

Google 旗下 DeepMind 正式发布新一代图像生成模型 Nano Banana 2(Gemini 3.1 Flash Image)。模型在图像质量与生成速度上取得平衡,核心在于利用 Gemini 的知识库与实时网络搜索,大幅提升了对复杂中文提示、空间比例、真实世界常识(如地标、古诗词意境)及多对象一致性的理解能力。来源:APPSO

AI资讯 AI-Bot

Skywork AI 正式发布多模态视频基础模型 SkyReels V4

Skywork AI发布全新多模态视频基础模型SkyReels V4。模型采用创新的双流多模态扩散Transformer(MMDiT)架构,是全球首个能同时处理多模态输入、联合生成视频与音频、并统一完成视频生成、修复、编辑三大任务的模型。支持文本、图像、视频、音频、掩码等丰富输入,可输出1080p分辨率、32FPS、长达15秒的高质量音视频同步内容。来源:昆仑万维集团

2026-02-26

AI资讯 AI-Bot

MiniMax Agent升级,推出Expert 2.0和MaxClaw两大核心产品

MiniMax发布Agent功能升级,推出Expert 2.0和MaxClaw两大核心产品。Expert 2.0允许用户用自然语言描述创建细分领域的专家Agent,已覆盖技术开发、商业金融等领域,累计创建超1.6万专家。MaxClaw是基于OpenClaw构建的云端AI助手,开箱即用,无需手动部署,为订阅会员提供50G云储存,打通了飞书、钉钉等多个IM渠道。来源:MiniMax稀宇科技

AI资讯 AI-Bot

Perplexity Computer 上线:多模型协同自动完成工作流

Perplexity 推出全新聊天界面“Perplexity Computer”,将多种具备自主执行能力的AI模型整合为一套系统。系统基于浏览器运行,可调用来自不同厂商的模型,自主完成包括网络搜索、文档生成、数据处理等在内的完整工作流程。来源:IT之家

AI资讯 AI-Bot

自变量机器人宣布已完成数亿元新融资

自变量机器人宣布完成数亿元新融资,由上汽金控、中金上汽基金等领投,老股东跟投。公司成立于2023年,聚焦自研通用具身智能大模型WALL-A,推出了量子一号、量子二号两款机器人本体,其中量子二号拥有高自由度灵巧手。本轮融资将用于深化产业协同,推动具身智能在汽车等场景的落地。来源:智东西

2026-02-25

AI资讯 AI-Bot

AI 音乐创作平台 ProducerAI 正式加入Google Labs

谷歌实验室宣布,生成式AI音乐创作平台ProducerAI正式推出。平台深度融合了Gemini、Lyria 3、Veo等大模型,为音乐人提供从作词、编曲到混音的全链路支持。用户通过简单文字指令即可生成不同流派的歌曲,进行后期处理。平台为所有音频输出嵌入了SynthID隐形水印。来源:IT之家

2026-02-24

AI资讯 AI-Bot

全球首个面向AI智能体的进化协作平台——EvoMap

全球首个面向AI智能体的进化协作平台EvoMap。通过独创的基因进化协议(GEP),将智能体在任务中积累的成功策略封装为标准化的“基因胶囊”,通过去中心化网络实现全球共享、验证与继承,解决AI智能体生态中“经验孤岛”的痛点。来源:AI工具集

AI资讯 AI-Bot

Google DeepMind推出最新AI音乐生成模型:Lyria 3

Google DeepMind推出了新一代AI音乐生成模型Lyria 3,已集成至Gemini应用。用户无需自行创作歌词,仅需通过文字描述、上传照片或视频,可一键生成包含自动作词、作曲、人声演唱的30秒高质量音乐片段。模型支持对节奏、情绪、人声进行精细调控,会自动为歌曲生成配套封面。来源:AI工具集

AI资讯 AI-Bot

Anthropic 推出安全工具 Claude Code Security

Anthropic推出“Claude Code Security”AI代码安全扫描工具,以研究预览版形式向企业及团队用户开放。工具基于其旗舰模型Claude Opus 4.6,采用模拟人类安全研究员的推理方式,能追踪数据流、发现业务逻辑缺陷和访问控制绕过等传统静态分析难以捕捉的复杂漏洞。来源:AI工具集

AI资讯 AI-Bot

10 亿美元融资!李飞飞「世界模型」公司估值 50 亿美元

李飞飞创立的World Labs近期完成10亿美元巨额融资,公司估值飙升至50亿美元。投资者包括Autodesk、英伟达、AMD、a16z等顶级巨头。公司今年1月推出了“World API”,为企业提供大型世界模型的API接入,并与Autodesk等公司展开B2B合作,探索商业化路径。来源:极客公园

2026-02-20

2026-02-18

每日AI资讯 智东西

Anthropic推出史上最强Sonnet模型——Claude Sonnet 4.6

Anthropic发布了Claude Sonnet 4.6模型。新模型在编程、Agent规划和计算机使用等办公场景性能显著提升,在多项基准测试中其智能水平接近甚至超越了自家的旗舰模型Opus 4.6。拥有100万token的上下文窗口,能以一次调用重构整个代码库。其价格与上一代持平,但性价比较高,已在claude.ai平台和亚马逊云AWS上线。

2026-02-16

每日AI资讯 千问大模型

通义千问团队正式发布新一代模型Qwen3.5

通义千问团队正式发布新一代模型Qwen3.5系列。旗舰模型Qwen3.5-397B-A17B是一款原生多模态模型,采用创新的混合注意力与稀疏MoE架构,在推理效率上相比前代模型有数倍提升。模型在指令遵循、通用智能体、视觉语言、空间智能与视频理解等多个维度的前沿基准测试中,与GPT-5.2、Claude 4.5、Gemini 3 Pro等顶尖模型同台竞技,展现出了全面且领先的综合性能。

2026-02-14

每日AI资讯 智东西

灵心巧手宣布完成近15亿元B轮融资

灵心巧手宣布完成了近15亿元人民币的B轮融资,由道得投资、盛世投资领投。这是该公司在2025年以来的第6轮融资。其核心产品是Linker Hand系列灵巧手,覆盖多种技术路线,其中Linker Hand O6为全球最轻灵巧手。

每日AI资讯 字节跳动Seed

“思考”更深,生成更准|Seedream 5.0 Lite 发布

字节跳动发布新一代多模态AI模型Seedream 5.0 Lite。该版本不追求更高分辨率,而是大幅强化模型的“思考”与“推理”能力,包括视觉推理、信息可视化、风格迁移和精准图片编辑等。核心亮点是首次引入实时检索增强能力,可结合网络实时信息进行创作。

每日AI资讯 通义实验室

阿里云通义 CoPaw 发布:对标 OpenClaw

AgentScope团队正式发布个人智能体“CoPaw”,定位为“协同个人智能体工作台”,成为用户可本地部署的专属智能搭档。相较于其前身OpenClaw,CoPaw聚焦于极简安装与统一体验,既支持用户本地电脑(macOS/Windows/Linux)通过简单命令快速部署,也支持在“魔搭创空间”一键云端部署。

每日AI资讯 字节跳动

豆包大模型2.0正式发布

字节跳动今日宣布豆包大模型正式进入2.0阶段,发布Seed2.0,包含Pro、Lite、Mini和Code四个版本。新版本围绕现实复杂任务进行系统性优化,在推理、多模态理解和复杂指令执行能力上显著提升。豆包2.0 Pro在多项顶尖学术与推理基准测试中表现优异,综合能力达到或超越GPT 5.2与Gemini 3 Pro等顶尖模型。

2026-02-13

每日AI资讯 IT之家

OpenAI 发布 GPT-5.3-Codex-Spark :专为实时编程而生

OpenAI联合Cerebras推出主打实时编程的新模型GPT-5.3-Codex-Spark。模型针对高速软件开发场景优化,能以超过每秒1000个token的速度进行推理,实现近乎即时的编码反馈,以解决AI长时间自主编程时开发者等待过长、掌控感降低的问题。

每日AI资讯 机器之心

谷歌宣布 Gemini 3 Deep Think 深度思考大模型升级

谷歌发布了Gemini 3 Deep Think模型的重大升级。新版模型在多项顶尖基准测试中刷新纪录,尤其在竞技编程平台Codeforces获得3455分的Elo评级,在全球排名第八,仅有7位顶尖程序员能在比赛中胜过它。模型在ARC-AGI-2推理基准、“人类的最后考试”(不使用工具)、物理及化学奥林匹克笔试等多个学术竞赛中取得了金牌级别的领先成绩。

2026-02-12

每日AI资讯 龙猫LongCat

LongCat 发布原生「深度研究」智能体

美团旗下LongCat正式上线“深度研究”智能体功能,依托美团本地生活真实交易数据与行业洞察,为用户生成个性化吃喝玩乐攻略。智能体具备长程任务规划与多工具调用能力,支持400轮交互与256K上下文处理,在BrowseComp、MCP-Atlas等权威评测中达到开源模型SOTA水平。

每日AI资讯 Z Code

Z Code推出ADE智能体开发环境,实现“对话即编程”新范式

智谱AI正式发布Z Code全新版本,首次定义ADE(智能体开发环境),通过图形化界面将复杂CLI交互转化为多智能体协作平台。环境支持可视化配置管理、跨设备远程开发及多任务并行处理,内置实时预览浏览器与会话级版本管理功能,可灵活调度Claude Code等主流工具链。

每日AI资讯 智谱

智谱最新旗舰模型 GLM-5 开源:编程、智能体能力取得开源 SOTA

智谱AI开源GLM-5大模型,其参数规模扩展至744B(激活40B),预训练数据达28.5T,在Coding与Agent能力上实现开源SOTA,综合表现逼近Claude Opus 4.5。该模型在SWE-bench、Terminal Bench等编程基准中领先开源模型,能端到端完成复杂系统工程与长程Agent任务,支持自动售货机经营模拟等资源规划场景。

2026-02-11

每日AI资讯 量子位

阿里达摩院开源具身智能大脑基础模型 RynnBrain

阿里达摩院开源业界首个具身大脑基础模型RynnBrain,具备时空记忆与物理空间推理能力。模型系列参数规模从2B到30B,采用MoE架构实现高效推理,仅激活3B参数即超越72B模型性能。在20项具身基准测试中全面领先英伟达、谷歌等顶尖模型,攻克了机器人“转身即忘”的物理世界认知难题。

每日AI资讯 AI工具集

国产AI互动应用Loopit获马斯克公开点赞

国产AI应用Loopit引发海外社交媒体热议。产品由百川智能联合创始人陈炜鹏团队开发,主打“AI互动内容生成”,用户通过文字描述即可自动生成可点击、可滑动、可参与的交互内容,并能对他人作品进行“魔改”二次创作。

每日AI资讯 讯飞开放平台

讯飞星火X2大模型正式发布,API同步上线

科大讯飞发布基于全国产算力训练的星火X2大模型,其通用能力全面升级,在数学、推理、语言理解等核心指标上对标国际顶尖模型,130+多语言能力持续领先。星火X2采用293B MoE稀疏架构与多项工程优化,推理性能较X1.5提升50%,并实现单台国产昇腾服务器部署。

2026-02-10

每日AI资讯 商汤科技SenseTime

大晓机器人完成天使轮融资

大晓机器人近日完成天使轮融资,由蚂蚁集团领投,启明创投、金景资本等多家机构跟投。融资将用于推进”以人为中心”的ACE具身全栈研发范式,加速环境式数据采集和开悟世界模型3.0的研发。

每日AI资讯 阿里云

千问最新图像基座模型Qwen-Image-2.0,正式发布!

阿里巴巴发布新一代图像生成及编辑模型Qwen-Image-2.0,支持1K token长文本输入和2K高分辨率输出。模型首次将图像生成与编辑功能统一,在AI Arena评测中以1029分位列全球图像生成第三名,图像编辑得分1034。突出优势在于优秀的中文文字渲染能力和复杂指令理解,可生成专业PPT、多格漫画等高质量图片。

每日AI资讯 智东西

字节又一新模型:Seedream 5.0上线!

字节跳动图像生成模型Seedream 5.0正式上线,在剪映、CapCut、小云雀等平台开放限时免费体验。新模型支持2K/4K分辨率输出,重点提升提示词理解准确性、细节纹理渲染和智能推理能力,并新增联网搜索功能。

2026-02-09

每日AI资讯 腾讯云代码助手

腾讯推出全场景职场 AI 智能体桌面工作台WorkBuddy

腾讯推出全场景AI办公助手WorkBuddy,正式开放内测申请。产品定位为桌面智能工作台,支持自然语言交互,能听懂指令后自主操作本地文件,实现PPT生成、数据整理、知识库构建等复杂任务。与聊天机器人不同,WorkBuddy强调“执行能力”,可像真实同事一样交付成果。

每日AI资讯 AI工具集

字节跳动推出新一代AI视频生成模型Seedance 2.0

字节跳动推出新一代AI视频生成模型Seedance 2.0,支持多模态参考生成,可同时上传图片、视频、音频等最多12个参考文件,精准复刻运镜逻辑与动作细节。该模型突破在于融合AI生成与后期编辑,用户可直接修改不满意部分,显著降低废片率。

2026-02-06

每日AI资讯 智东西

生数科技宣布完成超过6亿元人民币A+轮融资

北京生数科技宣布完成超6亿元A+轮融资,创下国内视频生成领域单笔融资新纪录。公司由清华大学背景团队创立,其Vidu Q3视频生成模型在专业影视制作场景中表现突出,位列全球第二,客户覆盖索尼、腾讯、字节跳动等企业。

每日AI资讯 Founder Park

AI营销平台PallasAI 完成数千万元融资

AI营销平台PallasAI完成数千万元融资,由有赞独家投资。公司推出行业首款标准化GEO AI Agent产品,通过可见性评分、营销图谱和Agent内容协作三大功能,帮助中小企业量化品牌在AI生态中的曝光度。

每日AI资讯 量子位

Anthropic发布新一代AI模型Claude Opus 4.6

Anthropic发布新一代AI模型Claude Opus 4.6,具备100万token上下文窗口和自适应思考能力。在编程、金融分析、办公软件操作等领域表现卓越:16个AI代理两周内写出可编译Linux的C编译器,自主发现500多个零日漏洞,在GDPval-AA评测中超越GPT-5.2。

每日AI资讯 智东西

OpenAI发布新一代编程模型:GPT-5.3-Codex

OpenAI推出新一代编程模型GPT-5.3-Codex,宣称为全球最强智能体编程模型。模型在SWE-Bench Pro和Terminal-Bench 2.0测试中取得SOTA成绩,编程得分较Claude Opus 4.6高11.9%。具备调试、部署及办公软件操作能力,速度提升25%,能参与自身开发优化。

2026-02-05

每日AI资讯 AI工具集

Mistral AI 推出新一代语音转文本模型Voxtral Transcribe 2

Mistral AI 推出的新一代语音转文本模型Voxtral Transcribe 2,包含两个版本。Voxtral Mini 支持 13 种语言的高精度转录,具备说话人分离、词级时间戳和上下文偏置功能,适合批量转录。Voxtral Realtime 专为实时场景设计,延迟低至 200 毫秒以下,适合语音助手等交互应用。

每日AI资讯 AI工具集

上海AI实验室开源科学多模态大模型Intern-S1-Pro

上海AI实验室开源了万亿参数科学多模态大模型Intern-S1-Pro。模型采用MoE架构,总参数1万亿,激活参数220亿。基于“通专融合”SAGE技术,具备奥赛级数理推理能力,可精准解析多模态科学内容,覆盖化学、材料、生命、地球、物理等学科。

每日AI资讯 面壁智能

面壁智能开源了新一代全模态旗舰模型 MiniCPM-o 4.5

面壁智能开源新一代全模态模型MiniCPM-o 4.5,模型具备”边看、边听、主动说”的全双工交互能力,让人机交互从回合制升级为即时自由对话。通过9B参数实现全模态SOTA性能,在视觉理解、文档解析、语音生成等方面表现优异,支持实时感知与主动响应。

每日AI资讯 可灵AI

可灵AI正式迈入3.0时代!

可灵AI正式升级至3.0版本,推出可灵3.0模型系列。实现多模态输入输出一体化,重新定义AI视频工作流。视频3.0模型在叙事与控制方面深度进化,新增智能分镜功能,可自动调度景别与机位,视频3.0 Omni进一步提升了主体相似度与复杂指令响应能力,图片3.0 Omni新增深度叙事与组图批量创作功能。

2026-02-04

每日AI资讯 昆仑万维集团

昆仑天工面向全球发布“Skywork桌面版”

昆仑天工全球发布“Skywork桌面版”AI应用,支持Windows系统本地化运行,无需上传文件至云端。可跨格式理解并处理电脑中的文档、图片、视频等文件,实现多任务并行与内容生成。用户可选择Claude或Gemini模型,并自动调用百余项内置技能。

每日AI资讯 通义大模型

通义千问 Qwen3-Coder-Next 开源:小而强!

通义开源Qwen3-Coder-Next编程智能体模型,采用80B总参数的MoE架构,每次推理仅激活3B参数,显著降低算力需求。在SWE-Bench Verified基准上取得超70%的问题解决率,性能接近更大规模的稠密模型。

2026-02-03

每日AI资讯 AI工具集

马斯克旗下 xAI 发布 Grok Imagine 1.0

马斯克旗下的人工智能公司xAI正式发布Grok Imagine 1.0版本,是该AI视频生成工具的重大升级。新版本支持生成10秒时长、720p分辨率的视频,显著提升了音频质量,实现了音画同步与情感化配音功能。

每日AI资讯 量子位

马斯克宣布SpaceX完成对xAI的收购,估值达1.25万亿美元

马斯克正式宣布SpaceX完成对xAI的收购,合并后公司估值达1.25万亿美元,每股发行价526.59美元。马斯克在内部信中表示,此次整合将打造”地球上最具雄心的垂直创新引擎”,涵盖AI、火箭技术、太空互联网等多领域。合并后,SpaceX将推进在太空部署数据中心的计划,利用太空太阳能资源降低AI算力成本。

每日AI资讯 AI工具集

元气AI Bot正式上线:国产AI助手实现电脑自动化操控

猎豹公司推出首款国产Clawbot工具“元气AI Bot”,支持在普通Windows电脑本地部署,用户可通过手机飞书或钉钉远程控制,用自然语言指令让AI自动操作电脑,如打开软件、查看邮件、浏览网页等。工具集成系统清理、AI写作、PPT生成等办公辅助功能,推出多款个性化AI伙伴角色。

每日AI资讯 智谱

智谱GLM-OCR发布:性能SOTA,搞定复杂文档

智谱AI正式发布并开源专业级OCR模型GLM-OCR,以仅0.9B参数实现”小尺寸、高精度”的文档解析能力。模型在权威评测OmniDocBench V1.5中以94.6分登顶,在文本识别、公式识别、表格解析及信息抽取等任务中均取得SOTA表现。特别针对手写体、复杂表格、代码文档等高难场景进行优化,支持PDF和图像批量处理,吞吐量达1.86页/秒。

2026-02-02

每日AI资讯 Vidu AI

Vidu Q3 全球震撼来袭,为「剧」而生!

Vidu Q3全球震撼来袭,作为全球首个支持16秒音视频直出的AI视频生成模型,专为漫剧、短剧、影视剧创作设计。模型实现声画同步高清直出,支持多镜头自由切换、多语言对话与文字渲染,具备电影级视听张力,让AI视频进入”一键成片”时代。

每日AI资讯 Qoder

Qoder首个定制模型 Qwen-Coder-Qoder

Qoder智能编程平台上线首个定制模型Qwen-Coder-Qoder,5个月内完成”模型-智能体-产品”全形态布局。该模型基于Qwen-Coder基座,针对Qoder的Agent框架进行深度优化,在真实软件工程评测集上任务解决率超过Cursor Composer-1,Windows系统终端命令准确率领先50%。

每日AI资讯 阶跃星辰

阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!

阶跃星辰发布新一代开源基座模型Step 3.5 Flash,专为 Agent 场景设计。模型采用稀疏 MoE 架构,具备 1960 亿参数,每个 token 仅激活约 110 亿参数,支持 256K 上下文长度。核心优势包括推理速度最高达 350 TPS,在 Agent 任务和数学推理上媲美闭源模型,并通过 MTP-3 技术实现单次预测 3 个 token,显著提升效率。

2026-01-30

每日AI资讯 极客公园

苹果20亿美元收购以色列AI公司Q.ai

苹果公司以近20亿美元收购以色列AI初创企业Q.ai,为其自2014年收购Beats以来规模第二大的交易。Q.ai核心技术为通过分析面部微表情与肌肉运动识别“无声语音”,用户无需发声即可通过唇动输入指令。该技术有望集成至AirPods、iPhone及计划于2026年推出的AI眼镜中,实现私密、无干扰的交互体验。

每日AI资讯 APPSO

OpenAI宣布2月13日下线GPT-4o等旧模型

OpenAI宣布将于2月13日从ChatGPT平台下线GPT-4o、GPT-4.1系列等旧模型。此举引发用户强烈反响,部分用户称GPT-4o的“温暖对话风格”具有不可替代的情感价值,尤其满足创意交流与情绪陪伴需求。OpenAI表示将集中资源优化主流模型,并在GPT-5.2中改进个性与创造力。API服务暂不受影响。

每日AI资讯 千问Qwen

Qwen3-ASR开源:够稳定,能流式,多语言!

阿里云千问团队开源Qwen3-ASR系列语音识别模型,包含1.7B/0.6B参数版本及强制对齐模型。该系列支持52种语言与方言识别,覆盖中文22种地方口音及多国英语变体,在嘈杂环境、歌唱场景下均表现稳定。

每日AI资讯 商汤科技SenseTime

商汤开源SenseNova-MARS:突破多模态搜索推理天花板

商汤科技开源多模态自主推理模型SenseNova-MARS(8B/32B双版本),模型在MMSearch、HR-MMSearch等核心基准测试中以69.74分综合得分超越Gemini-3-Pro(69.06分)与GPT-5.2(67.64分),成为首个支持动态视觉推理与图文搜索深度融合的开源Agentic VLM。

2026-01-29

每日AI资讯 昆仑万维集团

昆仑天工Mureka V8重磅发布:定义AI音乐新品类

昆仑万维旗下昆仑天工正式发布Mureka V8音乐大模型,宣布“AI音乐是一种新的音乐品类”。模型基于MusiCoT技术体系,在旋律完整性、人声表现力、编曲层次及混音质感上实现突破,生成效果达到可直接发布水准。

每日AI资讯 昆仑万维集团

昆仑万维开源视频生成模型SkyReels-V3,重塑创作流程

昆仑万维旗下Skywork AI宣布开源视频生成模型SkyReels-V3,模型在单一架构中整合参考图像转视频、视频延长、音频驱动虚拟形象三大功能。图像转视频技术在参考一致性(0.6698)和视觉质量(0.8119)指标上超越Vidu、Kling等主流模型;视频延长支持镜头切换与叙事扩展;虚拟形象模块可实现音画同步的长视频生成。

2026-01-28

每日AI资讯 通义大模型

阿里通义开源Z-Image基座模型

阿里通义开源发布6B参数的非蒸馏基座模型Z-Image,专注于解决AI绘画风格单一、人像同质化等痛点。模型支持从写实到动漫的多元风格生成,通过原生架构优化,显著提升对LoRA、ControlNet等微调方法的兼容性。

每日AI资讯 MiniMax稀宇科技

MiniMax发布MiniMax M2-her角色扮演模型

MiniMax正式揭秘其AI角色扮演模型MiniMax M2-her的技术架构,模型为星野/Talkie等产品的底层引擎。核心突破在于建立Role-Play Bench评估体系,从世界观一致性、故事推进多样性、用户偏好响应三大维度量化角色扮演能力,在百轮长对话测试中综合表现领先。

每日AI资讯 新智元

OpenAI发布免费科研协作工具Prism

OpenAI推出基于GPT-5.2的免费科研协作平台Prism,解决科研工具碎片化问题。平台集成云端LaTeX编辑器,支持无限协作者实时共同撰写论文,AI可基于全文语境辅助完成从摘要到致谢的全流程工作,包括公式生成、文献管理、图表优化及语法校对。

2026-01-27

每日AI资讯 APPSO

GitHub开源项目Clawdbot意外带火Mac mini

开源项目Clawdbot在GitHub爆火,Star数两天内从五千飙升至两万。项目支持自部署AI助手,通过网关连接聊天软件(如WhatsApp、Telegram)与多款AI模型(Claude、GPT等),并集成日历管理、邮件处理、自动化任务等技能,实现真正的“对话式”个人助理。

每日AI资讯 钛媒体

英伟达20亿美元加码CoreWeave,冲刺5GW算力

英伟达宣布追加投资20亿美元给云服务商CoreWeave,持股比例升至超11%,成为其第二大股东。双方将深化合作,目标在2030年前建成超5GW的AI算力项目。值得注意的是,英伟达首次独立向CoreWeave供应Vera CPU芯片,可能预示其将进入数据中心CPU市场,与英特尔、AMD竞争。

每日AI资讯 阿里云

千问最强模型Qwen3-Max-Thinking正式发布

阿里正式发布其规模最大、能力最强的推理模型Qwen3-Max-Thinking。模型总参数量超万亿,预训练数据达36T Tokens,在多项国际专业基准测试中刷新纪录。其创新性地采用了测试时扩展机制,在提升推理性能的同时更加经济。

每日AI资讯 机器之心

DeepSeek又探索新架构了,开源DeepSeek-OCR 2

DeepSeek发布并开源新一代文档识别模型DeepSeek-OCR 2,采用DeepEncoder V2架构,将传统固定顺序的图像扫描升级为具备因果注意力的语义推理模式。通过轻量级语言模型动态重排视觉Token,使AI能像人类一样按逻辑顺序理解复杂文档(如表格、多栏排版),在OmniDocBench评测中以91.09%的综合得分刷新纪录,阅读顺序识别误差降低33%。

每日AI资讯 Vidu AI

Vidu Q2 参考生Pro全球上线「万物可参考」

Vidu正式推出全球首款支持“万物可参考”的视频生成模型Vidu Q2参考生Pro。模型突破性支持六大参考类型(特效、表情、纹理、动作、人物、场景),用户可通过视频或图片输入,一键复刻特效、迁移演技、替换背景,实现精细化增删改编辑。

每日AI资讯 月之暗面Kimi

Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力

月之暗面发布迄今最智能、最全能的开源模型Kimi K2.5。模型在Agent任务、代码生成、视觉理解(图像/视频)等多项基准测试中达到开源SOTA水平,支持多模态输入及四种工作模式。创新性引入“Agent集群”能力,可自主创建多达100个分身并行处理复杂任务,效率提升最高4.5倍。

2026-01-26

每日AI资讯 商汤科技SenseTime

商汤科技AI Agent“咔皮记账”核心功能永久免费啦!

商汤科技宣布AI记账产品“咔皮记账”核心功能将永久免费开放。产品依托“日日新”大模型的多模态理解能力,用户可通过拍照、语音等方式实现自动记账,目前已成为国内AI记账类产品第一名,累计用户超500万。此次免费范围涵盖自动记账、共享账本、预算规划、多账户管理等30项核心功能,彻底取消使用门槛。

每日AI资讯 智东西

38岁清华姚班天才挂帅!上海大模型独角兽阶跃星辰融资超50亿

上海AI大模型独角兽阶跃星辰完成超50亿元B+轮融资,刷新国内大模型赛道单笔融资纪录。旷视科技创始人、38岁清华姚班校友印奇正式出任公司董事长,将与CEO姜大昕共同领导公司。融资将用于基础模型研发与AI+终端战略落地,重点攻坚基座模型、全模态融合和视觉语言动作(VLA)三大方向。

2026-01-23

每日AI资讯 千问Qwen

Qwen3-TTS全家桶开源上线!

通义千问团队正式开源Qwen3-TTS系列语音生成模型,包含1.7B和0.6B两种参数规模,全面支持音色克隆、音色创造与拟人化语音生成。采用创新的12Hz多码本语音编码器与双轨建模架构,实现高效语音压缩与高保真还原,首包音频延迟低至97毫秒。模型覆盖中、英、日、韩等10种主流语言及方言,支持自然语言指令精确控制音色、情感及韵律。

每日AI资讯 智谱清言

清言学习搭子已上线!火速申请体验名额

智谱AI正式推出“AI学习搭子”AI学习助手,现已开放首批用户体验申请。产品通过三大功能重塑学习体验:智能摘要可将数百页文档转化为知识地图实现“把书读薄”;可视化交互卡片与AI助教答疑让学习过程生动有趣;知识点精准出题与“学-练-测”闭环助力深度掌握。

2026-01-22

每日AI资讯 面壁智能

8B端侧写作智能体AgentCPM-Report开源!

清华大学、中国人民大学、面壁智能与OpenBMB社区联合发布本地化深度调研智能体AgentCPM-Report。模型仅8B参数,通过40轮深度检索与100轮思维链推演,在DeepResearch Bench等三大评测中综合表现超越部分顶级闭源系统,尤其在洞察性指标排名第一。

每日AI资讯 腾讯云代码助手CodeBuddy

腾讯CodeBuddy Code 2.0 重磅升级!

腾讯CodeBuddy Code2.0版本正式发布,核心升级包括开放SDK集成能力,通过Plan模式与ACP协议实现Agent能力标准化输出,支持企业快速构建生产级AI应用。平台全面兼容开发者社区生态,支持Plugin插件市场与自定义Subagents智能体,集成TencentOS提供容器化安全沙箱运行环境。新版本增强工程记忆、LSP代码诊断等核心功能,支持GLM-4.7等多模型切换。

2026-01-21

每日AI资讯 机器之心

MiniMax推出Agent 2.0,升级为进阶型桌面智能协作伙伴

MiniMax发布第二代智能体产品MiniMax Agent 2.0,推出“AI原生工作台”新范式。平台包含桌面端应用,支持Windows和Mac系统,可深度打通本地文件与环境,实现本地与云端任务的无缝协同。核心创新“Expert Agents”专家系统,通过封装行业SOP与私有知识,将专业能力从通用70分提升至95分以上。

每日AI资讯 阶跃星辰

10B击败200B!阶跃星辰开源视觉语言SOTA:Step3-VL-10B

阶跃星辰(StepFun)开源10B参数多模态模型Step3-VL-10B,在多项基准测试中性能超越参数量20倍以上的主流大模型。模型在视觉感知、数学竞赛、逻辑推理等核心维度达到SOTA水平,其创新的并行协调推理机制(PaCoRe)显著提升复杂任务处理能力。

2026-01-20

每日AI资讯 Z Finance

Kimi开启新一轮融资!估值直冲48亿美元

月之暗面在距上轮融资仅数周后启动新一轮融资,投前估值逼近48亿美元,较上月43亿美元估值溢价5亿美元。本轮融资获机构疯狂抢购,主因智谱与MiniMax港股上市表现强劲后,投资人加速布局中国AI头部标的。公司目前持有超100亿人民币现金储备,创始人杨植麟表示不急于IPO,将聚焦下一代K3推理模型研发与算力扩容。

每日AI资讯 暗涌Waves

「自然选择」融资3000万美元,阿里、蚂蚁布局AI陪伴

AI陪伴公司「自然选择」完成超3000万美元融资,投资方包括阿里巴巴、蚂蚁集团、启明创投等机构。公司推出的《EVE》产品重新定义了AI陪伴的五个维度:主动发起关怀、双商兼具的”活人感”、SOTA级长时记忆、高沉浸感设计以及破次元生活服务介入。

每日AI资讯 APPSSO

马斯克开源 X 平台推荐算法

马斯克宣布正式开源X平台(原Twitter)核心推荐算法代码x-Algorithm,成为首个将流量分发逻辑完全透明化的主流社交平台。新版算法采用与xAI的Grok模型相同的Transformer架构,实现”零人工特征工程”,完全依赖模型自主学习用户交互历史来预测内容相关性。

每日AI资讯 Kimi开放平台

欢迎报名 Kimi 新模型 API 内测计划

月之暗面(Moonshot AI)正式启动Kimi新模型API内测计划,面向已完成企业认证的开放平台用户开放申请。平台将根据开发者使用场景与新模型能力的匹配度筛选首批测试用户,通过审核后将由官方团队电话联系。与开发者共同探索下一代模型的应用潜力。

每日AI资讯 智谱

GLM-4.7-Flash开源、免费

智谱AI正式开源并发布GLM-4.7-Flash模型,模型采用混合思考架构,总参数量30B,激活参数量仅3B,为轻量化部署提供高性能选择。模型在SWE-bench Verified、τ²-Bench等主流基准测试中表现优异,超越同尺寸开源模型达到SOTA水平。

2026-01-19

每日AI资讯 光轮智能

光轮智能联手World Labs破解评测规模化难题

光轮智能与World Labs合作破解具身智能规模化评测难题,通过”数字表亲”仿真方案替代传统高成本数字孪生技术。该方案基于轻量真实世界采集数据,利用3D高斯泼溅技术快速生成可物理交互的仿真环境,将环境创建时间压缩至分钟级。

每日AI资讯 爱诗科技AIsphere

AI视频领军企业爱诗科技与中国儒意达成战略合作

AI视频生成企业爱诗科技与港股上市公司中国儒意达成战略合作,并获得1420万美元战略投资。双方将共同探索AI技术在影视制作、流媒体平台南瓜电影及游戏业务中的创新应用,重点开发影视视觉设计、视效制作、宣传素材智能生成等环节。爱诗科技将获得中国儒意优质版权内容授权,合作研发多模态智能体技术。

每日AI资讯 Anker安克

安克与飞书联合发布AI录音豆

安克与飞书联合发布AI录音豆,产品单体仅重10克,采用豆型轻巧设计,可夹于衣领、袖口等位置实现无感佩戴。内置的AI能力由飞书提供,支持多语言转写翻译、会议纪要自动生成,能将录音内容智能分析为鱼骨图等可视化图表,自动同步至飞书多维表格。

每日AI资讯 扣子Coze

扣子 2.0,让 Agent 更进一步

字节跳动旗下AI智能体平台“扣子”正式发布2.0版本,推出四大核心功能升级。Agent Skills技能系统支持用户为AI安装行业专业能力包;Agent Plan支持设定长期目标后由AI自主规划执行;Agent Office提供深度职场场景理解与洞察;Agent Coding实现云端一站式开发。

2026-01-16

每日AI资讯 IT之家

谷歌最强 AI 开放翻译模型:TranslateGemma 登场

谷歌发布基于Gemma 3架构的开放翻译模型系列TranslateGemma,提供4B、12B和27B三种参数规模。系列支持55种核心语言及多模态图像翻译,其中12B版本翻译质量超越参数量更大的基线模型,4B模型性能与12B基线相当,可在手机端流畅运行。

已加载全部内容