开云APP下载在DeepSeek老家发新模型豆包怎么想的？

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

开云APP下载在DeepSeek老家发新模型豆包怎么想的？

2025-04-18

浏览次数：次

返回列表

　　开云体育[永久网址:363050.com]成立于2022年在中国，是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网，欢迎注册体验！

开云APP下载在DeepSeek老家发新模型豆包怎么想的？

　　尽管研发模型是当前最紧要的任务，但凤凰网科技从豆包内部人士处了解到，内部对应用层的投入同样巨大，“拿的资源不比模型层少”。

　　4月17日，火山引擎总裁谭待现身杭州，分享近四个月以来字节豆包大模型的研发进展。

　　其中最值得关注的，是思考模型Doubao-1.5-thinking-pro的正式上线。目前，其已通过火山引擎正式开放体验接口。

　　DeepSeek最先凭借推理模型震惊海外，大厂的步伐相对滞后，这让去年AI战略被打满分的字节跳动略显尴尬。

　　不过，有行业人士对凤凰网科技表示，“豆包的步伐会慢，跟它用户量级大有关，如何平衡投入产出比是个问题”。

　　据谭待表述，豆包大模型在3月底日均tokens使用量已超12.7万亿，是2024年12月的3倍，一年前的106倍。

　　在基座大模型愈发呈现寡头之势的当下，豆包大模型的一举一动也备受外界关注。

　　根据官方测评，豆包深度思考模型的人类评估表现超出DeepSeek R1 8%，同时单位推理成本相比DeepSeek R1降低了50%。

　　在数学推理、编程竞赛、科学推理等专业任务领域，该模型性能相较OpenAI o3-mini-high、Gemini 2.5 Pro等模型同样并不逊色。用谭待的话来说，就是“均达到或接近全球第一梯队”。

　　另一亮点是多模态的能力，毕竟DeepSeek迟迟不支持除文字以外的内容。

　　本次豆包深度思考模型专门打造了一款视觉版，具有原生多模态深度思考能力，可以一键拍图识别地点、识别外文菜单。

　　目前，在AppStore内豆包已重回免费榜第一，DeepSeek目前排名第三，元宝则位于第八。

　　2月初，火山引擎官方即全面支持DeepSeek系列大模型，但另一边，豆包自身还在铆足劲进行模型研发投入。

　　当月下旬，字节跳动旗下AI助手豆包开始小范围测试深度思考模型的消息，彼时豆包相关负责人对媒体回应称，豆包App在测试的是其深度思考模型的不同实验版本；3月5日，豆包宣布上线深度思考推理模式，并以输入框的“深度思考”按钮为功能入口。

　　直到本次推理模型全面上线，坦诚讲，虽然没有DeepSeek R1出现时的那种惊艳，但大厂全面作战的能力更强，在产品细节上的打磨更为细致。

　　比如基于豆包深度思考模型，豆包App进行了定向训练，让模型具备了“边想边搜”的能力。思考过程中，豆包可基于推理，多次调用工具、搜索信息，提供更加全面、准确的结果。

　　除此之外，视觉理解模型解决了DeepSeek R1只能做文字输入的最大难点。

　　出国旅游时遇到的最大难题之一——点菜。“只翻译菜单是不够的，能直接点菜才是完美”。除此之外，模型还要思考如何换算汇率来控制预算，还要弄懂外文菜单的意思，如果有老人、孩子，要照顾他们的喜好，是否过敏等等。根据谭待现场所举的例子，豆包深度思考模型首先兑换货币控制预算，周全考虑老人孩子喜好，还细致避开过敏菜肴，非常出色地完成了任务。

　　人员架构上引入新的技术大拿，最著名的当属从谷歌加入字节的、曾参与Gemini开发的Google follow吴永辉博士。

　　此后其便领导豆包大模型团队加足马力，与此同时朱文佳继续负责模型应用相关工作。

　　尽管研发模型是当前的紧要任务，但凤凰网科技从豆包内部人士处了解到，内部对应用层的投入同样不低。“最近一个多月，各个产品部门都拉满了，个别部门还在憋大招。”

　　去年5月“豆包大模型家族”正式发布时惊艳四座，价格屠夫成为字节在大模型市场的一个新标签。

　　今年2月，百度智能云事业群总裁沈抖还曾在全员会上暗戳戳的表示，“国内大模型去年‘恶意’的价格战，导致行业整体的创收相较于国外差了多个数量级”。当时，谭待通过朋友圈回应称，大模型降价是通过技术创新实现的，大家应像DeepSeek一样聚焦基本功，少做无端猜测。

　　凤凰网科技在查询官方后发现，豆包推理模型的输入、输出价格分别为0.004元/千token和0.002元/千token，同等级模型，阿里qwen-plus输入价格可做到0.0008元/千token，输出价格与豆包模型一样。DeepSeek R1的API价格在忙时段，输入和输出分别可达0.001元/千token和0.016元/千token。

　　另据官方表示，豆包深度思考模型采用MoE（混合专家）架构，总参数为200B，每次推理时激活的参数为20B，可以更低延迟。相比之下，DeepSeek-R1总参数规模为671B，激活参数为37B。

　　在提及本次模型更新中的难点时，谭待表示，整体来说是实现效果好最难。“因为要先用各种方法达到最好的效果，在这个基础上再用各种方式去降低成本，这是一个优化的过程”。其认为，好效果能带来更大的突破，解锁更多的场景，吸引更多的用户和企业使用。所以得以预见，豆包推理模型的API价格未来还将处于动态调整的过程中。

　　包括朱啸虎在内的一众行业人士均认为，当前国内已经有很好的开源模型，这使得应用市场出现了显著的机会。业内越来越多人亦认为大模型的竞争最后只会剩下几家。

　　如李开复所言，“中国大模型未来大概率只剩下DeepSeek、阿里和字节跳动三家”。不过即便如此，相较于DeepSeek和阿里，字节仍旧需要走出自己的路。

上一篇：从DeepSeek到“赤兔”：国产AI生态如何打破英伟达依赖开云APP下载？

下一篇：OpenAI并未让DeepSeek惊出一身冷汗开云APP下载

首页

关于我们

开云体育

产品展示

留言板

咨询研究

联系我们

开云体育NEWS CENTER

开云APP下载在DeepSeek老家发新模型豆包怎么想的？