道可云人工智能每日资讯｜OpenAI加码音频人工智能研发，备战首款硬件设备

道可云人工智能&元宇宙每日简报（2026年1月4日）讯，今日人工智能&元宇宙新鲜事有：

OpenAI加码音频人工智能研发，备战首款硬件设备

OpenAI正着手升级其音频人工智能模型，为推出首款人工智能驱动的个人硬件设备做准备。另有三位知情人士表示，该设备预计将以音频交互为核心功能。用户与语音版ChatGPT对话时，尽管聊天机器人可以语音应答，但支撑其音频功能的大语言模型，与驱动ChatGPT文本交互的模型并非同一个。公司研究人员认为，当前音频模型在应答准确率和响应速度上，均落后于文本模型。为此，知情人士称，过去两个月里，OpenAI已整合多个工程、产品和研究团队，全力攻坚音频模型优化，以适配未来的硬件设备。

MiniMax重磅推出M2.1编程模型

MiniMax 正式开源全新 M2.1 编程模型，同步上线 Hugging Face、ModelScope、GitHub 等平台。该模型获 vLLM “Day-0” 支持，且通过 KTransformers 技术，可在 RTX5090 等高端设备上实现高效 FP8 本地推理。

阿里开源新一代图像生成模型Qwen-Image

阿里正式开源新一代图像生成模型Qwen-Image-2512，实现人物肌肤质感、自然纹理还原与复杂文字渲染的大幅提升。仅需输入文字指令，新模型即可生成“零AI味”的高质量图片。同时，千问新模型支持流畅生成漫画风格PPT、数据信息图等复杂图像，可满足专业设计场景下的多样化需求。

微信搜索【道可云】，发送关键字“元宇宙”，即可免费进群体验人工智能技术，获取元宇宙、人工智能报告。后续还有更多XR/AI/元宇宙相关报告全文在群内发布~

道可云人工智能政策专题汇总平台收录了国家部委、各省市历来的人工智能相关政策，欢迎关注（点击查看人工智能政策专题平台https://case.daokeyun.com/policy）