DeepSeek开源新模型,用视觉方式压缩一切
10月20日,DeepSeek再度开源新模型。在GitHub(https://github.com/deepseek-ai/DeepSeek-OCR)上可以看到其最新模型名为DeepSeek-OCR,还是一款OCR(光学字符识别)模型,该模型的参数量为3B。该项目由 DeepSeek 三位研究员 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切 - 知乎
论文地址:https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-OCR DeepSeek 表示,DeepSeek-OCR 模型是通过光学二维映射技术压缩长文本上下文可行性的初步探索。 该模型主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解码器...
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切_token_文本...
论文地址:https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-OCR DeepSeek 表示,DeepSeek-OCR 模型是通过光学二维映射技术压缩长文本上下文可行性的初步探索。 该模型主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解码器...
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切_财富号_东方...
DeepSeek-OCR 在端到端模型测试中以最少的视觉 token 数达到了最先进的性能。 DeepSeek-OCR:上下文光学压缩 DeepSeek 探索的方法概括起来就是:利用视觉模态作为文本信息的高效压缩媒介。 什么意思呢?我们知道,一张包含文档文本的图像可以用比等效文本少得多的 Token 来表示丰富的信息,这表明:通过视觉 Token 进行光...
重磅!DeepSeek再开源:视觉即压缩,100个token干翻7000个
DeepSeek再发新模型!Github上,DeepSeek新建了DeepSeek-OCR仓库,目的是探索视觉-文本压缩的边界。常言道:一图胜万言。对LLM也是如此!在理论上,DeepSeek-OCR模型初步验证了「上下文光学压缩」的可行性——从少量视觉token中,模型能够有效解码出超过其数量10倍的文本token。也就是说,包含文档文本的单张图像,能以...
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切__财经头条...
我们或许能通过文本到图像的方法实现近 10 倍无损上下文压缩。 没想到吧,DeepSeek 刚刚开源了新模型,还是一款 OCR 模型。可以看到,该模型的参数量为 3B,刚上线不久就已经有 100 多次下载量了。 该项目由 DeepSeek 三位研究员 Haoran Wei、Yaofeng Sun、Yukun Li 共同完成。其中一作 Haoran Wei 曾在阶跃星辰工作...
DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本...
少量视觉token完成海量文本压缩 【DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩】财联社10月20日电,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为3B。
刚刚,DeepSeek 又发新模型,小而美玩出新高度
简言之,DeepSeek-OCR 表面上是个 OCR 模型,但实际上是在探索一个更宏大的命题:能否用视觉模态作为 LLM 文本信息处理的高效压缩媒介?初步答案是肯定的,7-20 倍的 Token 压缩能力已经展现出来了。当然,团队也承认这只是个开始。单纯的 OCR 还不足以完全验证「上下文光学压缩」,后续还计划开展数字–光学文本...
DeepSeek开源新模型DeepSeek-OCR 探索视觉-文本压缩边界_新闻频道...
为了降低开发者与企业用户的使用门槛,DeepSeek-OCR提供了全链路的工具链支持。模型已完整开源至Hugging Face Hub,用户可通过transformers库加载使用。官方还发布了详细的参数配置指南,明确不同硬件环境下的最优模型规格选择建议。同时配套开发了PDF转图像、批量处理脚本、结果可视化工具等辅助功能,即便是非专业技术人员也能...
9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源...
9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。 据悉,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。目前,寒武纪、华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作。
DeepSeek团队开源新模型DeepSeek-OCR
DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。 举报分享 热度 留言精选 请先登录再发表评论意见反馈箱:yonghu@yicai.com客服热线:400-6060101 Copyright 第一财经 ALL Rights Reserved
DeepSeek放大招!发布新模型并开源,API价格大幅下调!
目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。每日经济新闻综合...
刚刚,DeepSeek-V3.1「终极版」重磅发布!最大提升超36%,V4/R2还远吗?
量子位发表于量子位 用好Deepseek,看这一篇就够了 2025年,AI行业似乎被按下了快进键,这一切都开始于中国的首款AI推理模型Deepseek宣布开源。 首先,是国内的各种媒介(无论是文字新闻,还是长短视频)展开高热度讨论; 其次,是与国内外大… 仰望打开知乎App 在「我的页」右上角打开扫一扫 其他扫码方式:微信 下载知...
DeepSeek-V3.2-Exp开源:大模型效率革命来了?
更核心的挑战在于如何平衡"开源普惠"与"商业可持续"。开源模式需要持续的研发投入,而API降价又压缩了短期盈利空间,DeepSeek需在二者之间找到平衡点。对此,DeepSeek创始人表示:"我们坚信技术普惠是大模型发展的终极方向,短期的盈利让步是为了长期生态的繁荣,未来将通过企业级定制服务、行业解决方案等方式构建多元化盈利...
DeepSeek Janus-Pro-7B:AI图像生成新突破,体验网址直达!
2025年1月28日,DeepSeek创始人梁文锋宣布了一项重大突破:开源多模态AI模型Janus-Pro-7B。这一模型不仅在图像生成和多模态理解任务中超越了OpenAI的DALL-E 3和Stable Diffusion,还以其创新的“理解-生成双路径”架构和极简部署方案引起了AI社区的广泛关注。本文将详细介绍Janus-Pro-7B的技术亮点、性能表现及其开源意义...
英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型
他们观察到,当扩大 LLM 的规模时,无论是在多模态理解还是视觉生成任务中,损失函数的收敛速度相比于较小的模型都会有显著的提升。这个发现进一步验证了该方法的强大可扩展性。Janus-Pro 架构配置 Janus-Pro 训练的详细超参数 JanusFlow-1.3B 在发布 Janus Pro 的同时,DeepSeek 还发布了一个多模态理解模型 Janus...
Deepseek Prover V2:他们刚刚打造了史上最强数学模型!
最新模型已上新上deepseek-v3-0324 、deepseek-v3-search 、gemini-2.5-pro-exp-03-25、gpt-4o-image、 mistral-large-latest、mistral-small-latest、gemini-2.0-flash-lite、gpt-4.5-preview、gpt-4.5-preview-2025-02-27、claude 3.7 sonnet、grok3、o3-mini-all、o3-mini-high-all、deepseek-r1、gemini...
...评价2025年9月22日DeepSeek新发布的DeepSeek-V3.1-Terminus模型?
如何评价2025年9月22日DeepSeek新发布的DeepSeek-V3.1-Terminus模型?相比较于8月19日发布的DeepSeek-...
DeepSeek V3.1 Terminus:最佳开源智能体模型!强大、快速且经济...
1.6万 17 06:46 App 2025年超好用的十大AI工具!避免你被时代淘汰!免费且强大! 1299 0 40:21 App DeepSeek之后,AI的下一站 4423 9 02:43 App DeepSeekV3.2给老美的延时炸弹 3.3万 103 01:29 App Gemini 2.5pro国内无限制使用! 浏览方式(推荐使用) 哔哩哔哩 你感兴趣的视频都在B站 打开信息...