OpenAI宣布将从7月9日起停止其不支持的国家和地区的API使用,中国在禁用之列。智谱AI、月之暗面、零一万物等多家国内大模型厂商先后上线了“搬家”方案,并为新迁移开发者提供Token大礼包等。

OpenAI官方账号宣布,ChatGPT MAC版本桌面应用程序向公众免费开放使用,但原定于6月底向Plus用户开放的语音功能将推迟一个月上线。

过去的一天,国内外AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。

/ 01 / 大模型

1)OpenAI停止中国API服务,智谱AI、零一万物等国产大模型提供“搬家计划”

OpenAI在昨(25)日明确,将从7月9日起停止其不支持的国家和地区的API使用,中国在禁用之列。对于这些新迁移开发者,智谱AI、月之暗面、零一万物等多家国内大模型厂商先后上线了相应的“搬家”方案,从送Token、送时长到“送钱”,形式多样。

智谱表示,为新迁移开发者提供1.5亿Token赠送和迁移服务。

通义千问表示,将为OpenAI API用户中的中国开发者提供2200万免费Token和专属迁移服务。

MiniMax将对切换用户提供最新的abab6.5s版本的模型能力,并且免费使用一个月,不限制TPM和RPM,同时也不限制Token的使用数量。

硅基流动宣布,SiliconCloud平台内的Qwen、GLM、Yi系列的几款模型的API永久免费。

据零一万物介绍,赠送Yi API的新注册用户100元额度,平台充值赠送50%的到账额度,且上不封顶。

昆仑万维天工在“一键搬家计划”中,提供1.5亿Token的API调用资源。

2)OpenAI断供,讯飞星火发布国内最优解决方案

6月25日凌晨,OpenAI突然宣布对中国内地和中国香港断供。据讯飞星火开放平台显示,面向开发者的API五项“普惠政策”包括:

①星火Lite版本永久免费

②星火Pro版本免费试用1个月

③星火Max版本免费赠送1亿tokens

④首次公开发布的星火4.0 Ultra版本首单买一送一

⑤提供技术专家1V1支持服务

讯飞星火是首个基于全国产算力训练的大模型,受国际环境变化的影响最小,是最适合OpenAI中国开发者的“国产平替”。讯飞开放平台2010年率先开放人工智能API服务,截至目前,全球AI开发者团队已超过702万。

据悉,星火大模型V4.0将于6月27日正式发布,讯飞星火4.0 API届时同步上线。

3)中科大、哈工大、度小满推出自回归通用文生图模型,3秒生成高质量图像

中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。

4)OpenAI宣布推迟GPT-4o语音模式,发布macOS桌面版ChatGPT

OpenAI官方账号宣布,ChatGPT MAC版本桌面应用程序向公众免费开放使用,但原定于6月底向Plus用户开放的语音功能将推迟一个月上线。

5)讯飞星火大模型V4.0明日发布,对标GPT-4Turbo

科大讯飞宣布将于6月27日发布讯飞星火大模型的最新进展。公告称,讯飞星火大模型全面提升大模型底座七大核心能力,对标GPT-4Turbo,并发布多款新产品和应用,包括讯飞星火APP/Desk、星火智能批阅机、讯飞AI学习机、讯飞晓医APP、星火企业智能体平台等。

6)苹果上新视觉模型4M-21,搞定RGB、几何特征图、元数据等21种模态

苹果与EPFL联合开发的4M-21视觉模型能处理21种模态,包括图像、文本和结构化数据,提升跨模态检索和生成能力;模型通过对不同模态执行特定离散tokenization,实现统一处理,并在多数据集上联合训练,增强性能和适应性。

/ 02 / AI应用

1)钉钉发布 AI 搜索,将对所有 AI 大模型厂商开放,首批7家接入

钉钉推出7.6版本,AI搜索产品开启邀请测试。钉钉总裁叶军宣布,钉钉将对所有大模型厂商开放,构建“国内最开放 AI 生态”。

钉钉7.6版本升级后,用户创建的AI助理默认接入通义大模型,也支持用户根据自身需要切换AI大模型,首批可选择MiniMax、月之暗面、智谱AI、猎户星空、零一万物、百川智能6家大模型。

2)商汤AI办公小程序“Raccoon智能助手”上线

基于商汤日日新大模型推出的小程序Raccoon智能助手上线。Raccoon智能助手是商汤旗下数据分析产品办公小浣熊的小程序版本,可以直接插入微信聊天中的文件,可以对文件提炼重点、生成各类图表。所有结果采用流式方式输出。

3)荣耀发布手机行业首个端侧AI反诈检测技术

在上海世界移动通信大会上,荣耀发布了手机行业中首个端侧AI反诈检测技术。荣耀CEO赵明介绍,该技术可以精准识别用户视频通话中的画面要素。一旦发现视频中存在AI换脸现象,系统将立即向用户发出风险提醒,帮助用户警惕潜在的网络诈骗风险。

4)谷歌将推出明星网红AI聊天机器人,与Meta展开竞争

据外媒报道,谷歌正在基于明星和YouTube网红构建新的AI聊天机器人,由Gemini大语言模型提供技术支持。谷歌还在开发一项功能,让人们只需描述自己的个性和外表就可以创建自己的聊天机器人,类似Character.ai的做法。

5)ElevenLabs推首个iOS应用Reader,可将任何文本转化为AI语音

ElevenLabs推出的首个iOS应用“ElevenLabs Reader”,它可以将文本转化为用户可以在移动中听取的音频叙述。用户可以通过应用内添加自己的内容,并享受多种语音和口音选择的功能。

/ 03 / 投融资情报

1)哈佛华人辍学生创办AI芯片公司Etched,完成1.2亿美元融资

AI芯片初创公司Etched宣布完成1.2亿美元,以扩大其专用芯片的制造,并与Nvidia产品展开竞争,同时提供一种更具成本效益和能源效率的选择。

/ 04 / AI基础设施

1)“国奖”放榜,科大讯飞获得十年来AI领域首个国奖一等奖

全国科技大会、国家科学技术奖励大会、两院院士大会首次共同举行,国家自然科学奖、国家技术发明奖、国家科学技术进步奖等奖项重磅揭榜。

华为、科大讯飞、阿里云、小米等科技公司出现在获奖名单中,而科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目,斩获国家科学技术进步奖一等奖,这是十年来人工智能领域首次获得该奖项。

2)南大与旷视研究院联手推出无监督范式SeVa,破解视觉大模型对齐难题

南大与旷视研究院联手推出无监督范式SeVa,成功解决了视觉语言模型的偏好对齐问题,而且整个过程无需人类或GPT-4标注,大大降低了对齐成本,仅使用8k构造的无监督数据,就显著提升了VLM的指令遵循能力,降低了幻觉。

这项技术的核心在于自动化构造偏好数据的pipeline,通过对比偏好对齐前后的模型输出,可以明显看出变化。

3)Nature研究称语言≠思维,大模型学不了推理:

《Language is primarily a tool for communication rather than thought》表明人类大脑的语言网络与形式化推理分离,语言主要是交流工具,而不是思考的媒介。

研究通过fMRI等成像技术观察了大脑中语言区域的活动,发现语言网络支持语言理解和生成,对词义和句法结构有敏感性,但并非是思维的基础。即使在语言能力受损的情况下,人们仍能进行多种形式的推理,包括数学问题解决、执行规划和遵循非言语指令等。

4)牛津研究人员利用语义熵来识破AI“幻觉”

牛津研究员提出了利用语义熵来检测大型语言模型的“捏造”问题的方法,该研究已发表在《自然》杂志。该方法不需要额外的监督或强化学习,可以快速识别LLMs的“幻觉”问题,即使是在面对未知任务时也能应用,从而提高用户对LLMs的信任。

5)Q*项目公开发布,小模型推理能力百倍提升

近日,昆仑万维颜水成团队与新加坡南洋理工大学合作发布了名为Q*的项目,旨在提升小模型的推理能力。通过Q*算法,小模型在多个数据集上取得显著成果,超越了大模型如ChatGPT和Gemini Ultra,展示了Q*算法的潜力和有效性。