道可云人工智能每日资讯|OpenAI加码音频人工智能研发,备战首款硬件设备

道可云人工智能&元宇宙每日简报(2026年1月4日)讯, 今日人工智能&元宇宙新鲜事有:

OpenAI加码音频人工智能研发,备战首款硬件设备

OpenAI正着手升级其音频人工智能模型,为推出首款人工智能驱动的个人硬件设备做准备。另有三位知情人士表示,该设备预计将以音频交互为核心功能。用户与语音版ChatGPT对话时,尽管聊天机器人可以语音应答,但支撑其音频功能的大语言模型,与驱动ChatGPT文本交互的模型并非同一个。公司研究人员认为,当前音频模型在应答准确率和响应速度上,均落后于文本模型。为此,知情人士称,过去两个月里,OpenAI已整合多个工程、产品和研究团队,全力攻坚音频模型优化,以适配未来的硬件设备。

MiniMax重磅推出M2.1编程模型

MiniMax 正式开源全新 M2.1 编程模型,同步上线 Hugging Face、ModelScope、GitHub 等平台。该模型获 vLLM “Day-0” 支持,且通过 KTransformers 技术,可在 RTX5090 等高端设备上实现高效 FP8 本地推理。

阿里开源新一代图像生成模型Qwen-Image

阿里正式开源新一代图像生成模型Qwen-Image-2512,实现人物肌肤质感、自然纹理还原与复杂文字渲染的大幅提升。仅需输入文字指令,新模型即可生成“零AI味”的高质量图片。同时,千问新模型支持流畅生成漫画风格PPT、数据信息图等复杂图像,可满足专业设计场景下的多样化需求。

微信搜索【道可云】,发送关键字“元宇宙”,即可免费进群体验人工智能技术,获取元宇宙、人工智能报告。后续还有更多XR/AI/元宇宙相关报告全文在群内发布~

道可云人工智能政策专题汇总平台收录了国家部委、各省市历来的人工智能相关政策,欢迎关注(点击查看人工智能政策专题平台https://case.daokeyun.com/policy)