DeepSeek事件不断刷屏:美商标被抢注,推理服务上线引发关注
2月1日,#DeepSeek急于搜索微博,以搜索由Liang Wenfeng校友#抓住的主题。根据新华社的每日电信,引用了TC报告,总部位于美国Telson Group的公司申请了DeepSeek商标。据报道,德尔森集团的首席执行官兼创始人威利·卢(Willie Lu)与DeepSeek创始人Liang Wenfeng毕业于同一大学。
此外,根据华为云官方公共帐户2月1日的说法,DeepSeek-R1吸引了全球用户和开发人员的关注。在基于硅的流量和华为云团队之后,两党共同推出并基于Huawei Yunsheng Tengyun服务推出了DeepSeekr1/V3推理服务。
值得注意的是,最近几天,DeepSeek的受欢迎程度仍然很高。几天前,Nvidia,Microsoft和Amazon等AI巨头宣布可以使用DeepSeek。此外,DeepSeek带来的压力可能会强迫它。 OpenAi紧急情况推出了新一代推理模型O3 Mini,这是第一次向免费用户打开免费用户模型。
Guotai Junan指出,DeepSeek-R1是带有MIT许可证的完全开源型号的重量,并允许商业型号延伸,为开发人员提供了第二次创新的自由空间。该战略促进了中国在通用模型的开源领域中的第一个技术系统,并增强了全球AI话语权利。同时,开源生态可能会加速行业的技术路线。通常,由于同质性,一般模型会加剧竞争。只有拥有真正领先技术的公司才能保持这种趋势。因此,预计国内开源模型的突破将重塑全球AIGC技术路线和工业结构。
在美国校友Liang Wenfeng的商标,Liang Wenfeng的校友
根据新华社每日电讯报的报道,最近中国人工智能公司DeepSeek已成为大型网络攻击的目标。现在,该公司似乎面临新的麻烦:美国商标纠纷。另一家公司申请了DeepSeek商标:总部位于Tellawa的公司,名为Delson Group Inc.。
德尔森集团(Delson Group)声称,自2020年初以来,它一直在销售DeepSeek品牌的AI产品。其首席执行官兼创始人Willie Lu。 Willie Lu和DeepSeek创始人Liang Wenfeng毕业于同一大学-Zhejiang University。
DeepSeek,全名Hangzhou,深深地寻求人工智能基本技术研究有限公司,于2023年7月17日成立。它是一家创新的技术公司,专注于开发先进的大型语言模型(LLM)和相关技术。
DeepSeek于2024年12月26日启动了V3(基准测试GPT4O)。由于其出色的性能,用户很快就开始增长。同时,在1月20日发行R1(基准测试GPT-O1)之后,它离圆圈更远。根据一些数据,从1月22日起,美国DeepSeek的下载排名迅速达到了最高位置;根据QIMAI数据,截至1月30日,DeepSeek排名列表中的第一名。
1月24日,著名投资公司A16Z的创始人马克·安德森(Mark Anderson)发布说,DeepSeek-R1是他见过的最令人惊叹,最令人印象深刻的突破之一,这是开源的。那是对世界的。礼物。制度性最多的评估来自Scaleai的创始人Alexandrwang。他说:在过去的十年中,美国可能一直在AI竞争中引领中国,但是DeepSeek的AI模型发布可能“改变一切”。
AI巨人可以进入DeepSeek
1月31日,NVIDIA宣布NVIDIA NIM可以使用DeepSeek-R1。 NVIDIA官方网站当天发表的一篇文章指出,DeepSeek-R1是具有最先进的推理能力的开放模型。与直接响应相比,诸如DeepSeek-R1之类的推理模型将使用链思维,共识和共识,并使用链思维,共识和共识搜索方法来进行多个推理处理查询,从而生成最佳答案。
以上文章写道,为了帮助开发人员安全测试这些功能并构建自己的特工,DeepSeek-R1模型现已被用作NVIDIA NIM Microservice Preview版本。
据报道,DeepSeek以前曾创建了美国技术股票,该股票曾经影响了NVIDIA的股价17%的股票价格并引发了讨论。 NVIDIA之前还说,指的是DeepSeek的进度,代表了Nvidia芯片在大陆市场上的可用性。将来,DeepSeek将需要更多的NVIDA芯片来满足服务需求。
根据参考新闻,它引用了台湾东森新闻网。最近,与OpenAI紧密合作的Microsoft宣布DeepSeek-R1已正式包括Azure AI Foundry,成为Enterprise AI服务平台的一部分。
作为OpenAI的最大股东,Microsoft拥有OpenAI的长期资金以及其AI技术的深入整合。因此,在暴露了DeepSeek-R1的官方收入之后,外界非常关注Microsoft为什么正在研究DeepSeek,并且仍然决定R1 R1 R1该模型已包含在其AI服务中。
微软强调,DeepSeek-R1模型通过了“严格的红色团队测试和安全评估”,并经历了“模型行为自动化测试和广泛的安全性审查,以减少潜在的风险”。
微软在声明中还提到,微软将继续评估DeepSeek-R1模型,并可以在一定程度上进行调整和优化以提高其准确性和审查机制。
1月31日,亚马逊云技术还宣布,客户现在可以在Amazon Bedrolk和Amazon Sagemaker AI中部署DeepSeek-R1车型。此外,客户可以使用Amazon Tranium和Amazon Inderenitia通过Amazon EC2,Amazon Sagemaker AI部署DeepSeek-R1-Distill。
Openai首次向免费用户开放
DeepSeek的爆炸使世界在AI领域的竞争进一步激烈。 1月31日,当地时间,OpenAI正式推出了竞争推理模型O3-Mini,并首次开设了推理模型。
根据Openai的说法,O3-Mini支持开发人员调整“ AI推理的程度”,以分为三个级别:低,中和高。这种灵活性使O3米尼在面对问题时可以“更加努力地思考”,并且在效率需要效率时优先考虑响应速度。
根据OpenAI的说法,在2024年美国数学邀请赛(AIME 2024)测试中,O3-Mini(60%)低推理工作(60%)的准确性(60%)与O1-Mini相似,但速度更快;在媒体努力下,O3- Mini的准确性可以提高到79.6%,这相当于O1模型。在最大努力的水平下,O3米尼的准确性可以进一步提高到87.3%。就博士学位科学问题(GPQA钻石)而言,三种努力模型的准确率分别为70.6%,76.8%和79.7%。开发人员可以在低,中和高层推理中灵活地选择低,中和高级别推理的强度,以便在应对复杂挑战时,模型可以“深入思考”,或在响应时确保优先级快速响应。
Chatgpt Plus,Team和Pro用户可以在当天(1月31日)体验O3-Mini,一周后,公司用户将获得访问权限。从现在开始(1月31日),免费版本用户还可以选择“推理”模式或通过消息编辑器重新生成回复以尝试O3 Mini。这是ChatGpt首次为免费用户打开推理模型。
Openai发布了新的Model O3 Mini后,麻省理工学院的科学家以及著名的科学和技术播客主持人评估了Openai的O3-Mini是一个很好的模型。 DeepSeek的R1性能与之相似,但是价格更便宜,可以显示推理过程。更好的模型将继续出现(期待O3 Pro的出现),但是“ DeepSeek Mist”具有重要意义。五年后,人们仍然会记住这个伟大的时刻。它是科学技术史上的关键节点。某些原因是其地缘政治影响,当然还有许多其他原因。
机构:模型生态学的深层重建
DeepSeek最近发布了其最新的开源模型DeepSeek-R1,该模型达到了GPT-O1的性能,该模型的性能接近OpenAI,成本较低。这一进步解决了全球人工智能行业的长期“计算能力”路径依赖性,其影响也影响了资本市场。
从定价的角度来看,DeepSeek-R1不仅是开源的,而且API(接口)的价格也明显低于GPT-O1。 DeepSeek-r1输入(高速缓存),输出定价分别为100万个令牌1元和6元,少于55元和438元的GPT-O1,具有成本效益的优势。
国际投资银行摩根士丹利(Morgan Stanley)表示,“较大(模型)不再等于更聪明”,DeepSeek展示了一种有效的培训方式,可以显着提高数据质量并改善模型的模型架构。摩根士丹利(Morgan Stanley)表示,与国际知名的大型模型相比,DeepSeek的模型现在具有很高的成本优势,其成本大约要低。
Guotai Junan指出,DeepSeek-R1用开源,高性能和低成本API对OpenAI O1进行了基准测试。其蒸馏模型的出色性能将支持终端AI的部署,例如消费电子和智能驾驶。开源策略将重组一般模型中的竞争。预计它将加速创新迭代。这家证券公司表示,在训练阶段,R1通过大规模增强的学习技术,提高了很少标记数据的推理能力,并验证算法优化的效率。这项技术突破了海外公司在复杂任务中的技术垄断,为中国在全球竞争中的主要模型技术参与提供了经验支持。
长江证券还指出,国内模型推理能力正在领导该行业,他们对推理计算能力和应用程序方面的好处感到乐观。一方面,国内推理模型继续进行迭代,推理方面的扩展将带来明显的推理和计算能力要求;另一方面,DeepSeek-R1编制的800,000个样本进行了微调,小型模型推理功能得到了显着提高。或加速垂直模型的应用。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。