DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了
一夜之间,大模型的范式仿佛被 DeepSeek 新推出的模型给打破了。昨天下午,全新模型 DeepSeek-OCR 突然开源。在该模型的处理过程中,1000 个字的文章能被压缩成 100 个视觉 token,十倍的压缩下精度也可以达到 97%,一块英伟达 A100 每天就可以处理 20 万页的数据。这种方式或许可以解决大模型领域目前头疼的长上下文效率
DeepSeek新模型很疯狂:整个AI圈都研究视觉路线,Karpathy不装了|...
不管怎样,看起来 DeepSeek-OCR 确实是一个非常好用的模型,也已经有不少先行者开始用起来了: 当然,批评的声音依然是存在的,比如现在 Meta 工作的前 OpenAI 和 DeepMind 研究者 Lucas Beyer 就毫不客气地表示 DeepSeek-OCR 的方法并不存在渐进性,不像人类。 最后,在 DeepSeek-OCR 热烈的讨论人群中,也有一群外...
...整个AI圈都在研究视觉路线,Karpathy不装了DeepSeek-OCR可能...
机器之心:DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了 DeepSeek-OCR可能机器人的基础模型真的被DS干出来了。 除了语言是用文字token输入,其他看到的文字本质上就应该是视觉的。把文字打包到图像中,才符合机器视觉的逻辑。 从DeepSeek最新发布的DeepSeek-OCR模型来看,确实体现了将文字打包到图像...
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切
DeepSeek 表示,DeepSeek-OCR 模型是通过光学二维映射技术压缩长文本上下文可行性的初步探索。该模型主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解码器两大核心组件构成。其中 DeepEncoder 作为核心引擎,既能保持高分辨率输入下的低激活状态,又能实现高压缩比,从而生成数量适中的视觉 token。实验数据显示,当文本 ...
不装了,欧盟计划对deepseek下手,与美国达成科技同盟
欧美国家对中国人工智能的担忧不是没有原因的。DeepSeek的快速进步揭示了欧盟在AI研究上的挑战。比如,法国投入大量资金研发的AI模型Lucie,只运行了3天就停止了,这和DeepSeek的迅速发展形成了强烈反差。这种差异让欧盟对中国在AI领域实现超车感到担忧。于是,欧盟打算既限制中国AI的发展,又增加对AI科研的投入,希望在...
DeepSeek,震撼 AI 圈的 “神秘力量”
R1 模型的发布,让 DeepSeek 在全球 AI 领域声名鹊起,成为了众多科技公司和研究机构关注的焦点。仅仅一周后的 1 月 27 日晚间,DeepSeek 又有了新动作。其 85 后创始人梁文锋在社交平台上表示新版本即将发布。三个多小时后,人工智能开源社区 HuggingFace 显示,DeepSeek 发布了参数大小从 10 亿到 70 亿不等...
Deepseek VL-2:Deepseek 以他们全新的疯狂AI视觉模型强势反击...
Deepseek VL-2:Deepseek 以他们全新的疯狂AI视觉模型强势反击!, 视频播放量 5716、弹幕量 0、点赞数 42、投硬币枚数 2、收藏人数 54、转发人数 7, 视频作者 AI-seeker, 作者简介 ,相关视频:谷歌全新AI模型GEMMA 3以计算器级别的运行能力,智胜了最强大的模型!,重大新
不装了,OpenAI对DeepSeek动手了!
如今,OpenAI并没有推出新的模型,他们推出的是给美国政府的一份洋洋洒洒长达15页的提案。在3月14日提交的这份提案中,OpenAI要求对“令人印象深刻”的DeepSeek下手——既然打不过,那就封杀他。OpenAI在这份名为《人工智能行动计划》的政策建议书提出,要求美国政府立法禁止使用DeepSeek,并以“国家安全”为由将中国...
不装了,欧盟计划对deepseek下手,与美国达成科技同盟 (1)
DeepSeek的突然出现给中国AI领域注入了活力。1月20日,它首次公开露面;紧接着2月初,它的开源大模型DeepSeek-R1再次引起广泛关注。这个升级版的AI不仅推理能力提升显著,还能更好地适应各种应用场景。最让人惊喜的是,它的开发时间短、成本也低,这完全打破了人们对于高端AI模型的常规看法。在短短一个月内,我们...
封杀DeepSeek?终于不装了!
终于明白,国家超算平台接入DeepSeek和阿里千问,既是实力肯定,也是战略保护。 不管你愿不愿意,主权AI的大国博弈,对手都已经把高墙堆到了我们面前。 二 OpenAI真的急了,他们想封杀的,是整个中国AI。 不可否认,OpenAI依然是全球最顶级的AI大模型厂商,两年前当ChatGPT这首个“类人对话”的消费级AI问世后,迅速引发全...
沈逸:DeepSeek恐颠覆美国内核!嵌入中国“一带一路”全球都要疯狂...
沈逸:DeepSeek恐颠覆美国内核!嵌入中国“一带一路”全球都要疯狂!全开源低价高效,美AI恐彻底跪下!厉害我的国国国 立即播放 打开App,流畅又高清 打开App,看更多精彩视频100+个相关视频 更多 23.3万 826 27:36 App 美国博主:【深度】中国DeepSeek AI刺破了华盛顿的皇帝新衣 | Geopoli
OpenAI装都不装了,提案要求禁用DeepSeek
中国大模型公司杭州深度求索(DeepSeek)发布的开源模型DeepSeek-R1如同一股飓风,在市场掀起巨浪。DeepSeek之所以火爆科技圈,关键在于其只需要使用比OpenAI-o1低90%至95
deepseek彻底不装...@韦观Johnny的动态
deepseek彻底不装了,誓要让黄仁勋和英伟达“好好记住”这个年 英伟达的股票刚刚止跌,deepseek就连夜发布了新的大模型,杀的英伟达的股价节跌跌不停,直到美股收盘时,英伟达的股价已经跌去了17%。 黄仁勋这个年是彻底过不好了,他可能做梦都想不到,以前嘲笑中国人吃苦耐劳,现在变成了狠狠扎向自己的回旋镖。 幻方量化这...
带你一文读懂DeepSeek-R1新模型,为何震动了全球AI圈
本文关注DeepSeek-R1在技术上最重要的突破——用纯深度学习的方法让AI自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。 时隔不到一个月,DeepSeek又一次震动全球AI圈。 去年12 月,DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o和Claude Son...
AI大神Karpathy深度剖析DeepSeek_什么值得买
DeepSeek的强化微调真的太牛了,不仅数学更强,还会自我反思和多角度分析问题,简直就是AI界的思维升级版!Andrej Karpathy解析得超清楚,强烈推荐看看,未来AI就长这样
带你一文读懂爆火的 DeepSeek-R1 新模型技术,为何震动了全球 AI 圈
通常情况下,一个模型在训练过程中会采用一种固定的训练方法来增强其推理能力。 然而,DeepSeek 团队在 R1 模型的训练中,大胆尝试了三种截然不同的技术路线:直接强化学习训练(R1-Zero)、多阶段逐步训练(R1)以及模型蒸馏,并且都取得了成功。这两种训练方法和模型蒸馏都蕴含了众多创新元素,对整个行业产生了深远的影响。
DeepSeek新模型很疯狂:整个AI圈都研究视觉路线,Karpathy不装了
因为是开源的小模型,DeepSeek-OCR 第一时间经历了整个 AI 社区的检验,很多大佬在看完论文之后纷纷发表了看法,兴奋之情溢于言表。 OpenAI 联合创始成员之一,前特斯拉自动驾驶总监 Andrej Karpathy 表示,它是一个很好的 OCR 模型。 他表示,作为一个本质上是研究计算机视觉,暂时伪装成自然语言专家的人,他更感兴趣的...
美国不装了,日媒闻到味儿,火速抹黑DeepSeek上头版 - 知乎
终于,1月29日,DeepSeek的新闻登上日本雅虎头版。而且,是两条新闻同时登上头版了! 第一条,是《读卖新闻》的:DeepSeek使用不正当手段,从其它公司入手数据? 给不负责任的瞎猜造谣加上一个问号,就可以光明正大泼脏水。没错了,这是日媒惯用的“免责抹黑”话术。 第二条,是BBC日文版的:中国DeepSeek安全吗?土澳...
deepseek已经彻底不装了...@今夏漫漫的动态
deepseek已经彻底不装了,刚刚他们又发了新的大模型Janus-pro 这是要把老美薅到底啊,英伟达做梦都没想到,大过年的自己成了别人餐桌上的“猪”,这下不得不信幻方真的做空英伟达了,嫌英伟达一天-17%不够,还要再火上浇油加大力度 幻方确实是开创新赛道了,做量化的亲自下场搞产品,搞了产品不是为了卖出去挣钱而是为了...
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的...
尤其是在视频的第 2 个小时开始,他对最近爆火的 DeepSeek-R1 论文进行了深入介绍,并直言 DeepSeek R1 在性能方面与 OpenAI 的模型不相上下,它的出现推动了 RL 技术的发展。除了盛赞 DeepSeek-R1 的技术创新外,Andrej Karpathy 还对纯 RL 的学习能力给予了高度评价,但又指出 RL 非常非常擅长发现一种方法...