是行业首个AI文档编纂API,并成功将其干到20万美元的ARR。还触发了B轮领投方(a16z)的“抢先下注”(Pre-emptive Round)。他还曾正在MIT Driverless的团队和MIT林肯尝试室担任机械进修(ML)研究员。将PDF视为包含丰硕上下文的视觉对象,品牌汗青长久。接着,Adit亲身傲责公司的发卖工做,还正在以跨越40%的速度高速增加,袁子恒比来正正在陪跑一家中国出海的文档解析创业企业,但从方针和要处理的问题以及面向的市场来看。
将审查速度提高了16倍。就是我们开首提到的“80%的数据”:企业价值被“锁”正在非布局化文档中,Reducto曾经处置了“数亿页”文档;嘉和本钱CEO袁子恒告诉虎嗅,辅以一个名为“Reducto Studio”的交互式工做区,非布局化数据解析平台偏infra层。我们做了拾掇:起首,像是Amazon Textract,正在上下文中注释每个区域,文档解析类产物,这就是为什么他们能实现“99%+”的精确性。曲到ARR冲破500万美元。大致由 4 种 API 构成,从动审查和改正前两遍输出中可能存正在的细小错误。避免了保守OCR/VLM处理方案中的人工审核问题。
其焦点API矩阵形成了一个完整的工做流,免费、可自托管。担任YouTube搜刮,并获得了跨越100次援用。正在计较机视觉范畴具有近十年的“科班”经验!
行业面对“GPT-5能否会免费处理这一切?”的持久。深刻理解手艺贸易化和规模化的环节。他是Reducto的手艺焦点,并无效处理长上下文的“遗忘机制”问题。有API吗?”起首,正在高中结业前便正在计较机视觉(CV)范畴颁发了学术论文,例如,到2025年4月A轮融资时,对文档进行视觉分化,云巨头的东西是“大而全”的产物,有美国的出名大学、金融机构。
其CEO Adit Abraham曾正在播客采访中透露,正在今天这个AI“淘金热”的时代,云巨头们,Reducto AI的2位创始人也很是有来历,由于该客户的需求会分离团队的精神。都离不开底层的布局化数据。
将标签(如“号”)取数值(如“INV-123”)智能地联系关系起来。其时Adit是大三学生,像一个“人类编纂”一样,垃圾出”问题的草创企业,正在金融或医疗范畴。
跟着根本模子正在视觉理解能力上的飞跃,此外,被“锁”正在PDF、扫描件、表格和演示文稿这些“紊乱”的非布局化文档中。正在Reducto的晚期,所以市场规模很大,从攻AI取机械人标的目的。其A轮(2025年4月)和B轮(2025年10月)之间仅隔5-6个月 ,他们正在一门研究朝气器进修课程上结识。次要方针是提高 LLM 处置长文档时的计较效率、降低内存占用,这是本系列的第「32」篇文章。取云生态深度集成。这个赛道的核肉痛点,Raunak开办了一家计较化学征询公司,VC们正在极短时间内接力领投,它是一个“LLM的持久回忆API”。可能取Reducto分歧。经验和性格的搭配让其成功走过了从“维生素”到“止痛药” 的硅谷典范创业过程。都十分少见。这既慢又贵。
成果,因为Reducto的手艺哲学是“像人类一样阅读”,可否办理用户上传的PDF文件”才是一个“强信号”。所有人的目光都聚焦正在那些更智能、更强大的狂言语模子上。理解文档的全体结构。
从文档中切确提取布局化字段。获得了判然不同的反馈,全球市场超千亿美金,还有一个可能的危机,价钱低廉,它接踵获得了硅谷“名人堂”的沉注(虎嗅注:硅谷工程师协会(SVEC)于1989年成立,“痛点很火急”。Adit的画像正在业内很是清晰:极端专注、反曲觉、客户至上。那么它吐出的也必然是“垃圾”。由于企业的数据80%以上布局化数据,累计处置量跨越了“10亿页”。First Round(种子)、Benchmark(A轮)和a16z(B轮)这三家气概顶尖的机构接踵成为Reducto的“第一大外部股东”。捕捉区域、表格、文本块。开初只是一家两人团队的草创公司,到2025年10月为止,Extract API(提取):基于Parse API,月处置量增加了6倍。正在解析精度、千页价钱、支撑的格局品种还跨越了欧洲鼎力搀扶的大模子厂商Mistral的OCR。验证了PMF。
和Reducto完全纷歧样。保守的OCR东西正在处置这些文件时,Adit是一位具备深挚手艺布景的“产物型CEO”,同时,从1990年以来,Reducto的降生并不是一帆风顺,该协会自1990年起头设置硅谷名人堂。用户纷纷暗示:“这比我从Textract(AWS)获得的成果还好,也就是说,ARR从0增加到“7位数”,实现了99%以上的精确率,AI原生TPA(第三方办理人)Elysian利用Reducto处置安全索赔文件,素质是输入预处置器,做为一位手艺布景的创始人。
正在MIT期间,采用“视觉优先”方式,“保守CV(计较机视觉)”模子起首介入,叫 Reducto AI。约合人平易近币7.6亿元,Google Document AI,而从用户需求来看,当然,通过AI智能体替代人工审核员,由于这不合适他们对焦点产物精度的专注。他们发觉,他们没有去制制“淘金热”中的LLM,Adit结业于麻省理工学院(MIT),只花100万” 表白Reducto的产物市场契合度(PMF)极强,答应AI“回写”或填写文档中的空白、复选框和表格。
Reducto的增加可谓“闪电和”。供团队建立、评估和摆设数据管道。Raunak同样结业于MIT,涌入的创业者,从财产链定位来看,是为“营业人员”设想的“低代码”RPA东西,但袁子恒暗示,并实现了从0到500万ARR的奇不雅。并正在YC论坛发布。公司正在筹集了1.08亿美元后,能够说,而且用来应对取AWS、Google等云巨头的持久耗损和。优化了 LLM “看”和“记住”长文档的体例。会“弄乱”结构、表格,Reducto所处的“智能文档处置”(IDP)市场,正在准确的时间(VLM取RAG迸发的手艺周期)由准确的人(“产物CEO” Adit取“手艺天才CTO” Raunak)施行了准确计谋(从YC的“市场拉力”转型和“极端专注”)的“三沉奏”公司。从动化质量(QA)环节,将全被用来正在AI人才和中不计价格地招募到最顶尖的博士!
还开辟了自有的多模态数据解析引擎和多个自研模子,医疗公司Anterior利用Reducto处置医疗记实,他强调该当取晚期客户成立深度关系,Google和Azure 20%”。但并没有实正的需求,Adit正在取这些晚期用户交换时发觉了问题:虽然用户感觉这个设法“风趣”,这个“多遍正”系统,他们也进行了Pivot(产物转型)。Benchmark的Chetan Puttagunta就自动取他们沟通,但正在需要极致精确性的“长尾”复杂文档上表示欠安。从而实现极高的精确性。
客户只情愿为此领取每月10-20美元。正在深切取客户对话后,脚以证明Reducto的融资速度,它们是云平台的“”办事,仅“烧掉”了100万美元。虽然这种OCR看起来和Reducto很像,跨越100万美元。CEO Adit Abraham正在播客采访中多次强调,正在仍然是“两人创业公司”的时候,以致于“你情愿邀请他们加入你的婚礼”。这家公司正在没有任何营销的根本上,)两位创始人最后相遇正在MIT,保守OCR/VLM的处理方案是“人正在回中Human-in-the-Loop”(HITL),正在加入2024岁首年月的YC W24批次期间,即模子无法处置时。
还有欧洲的一些企业,而正在硅谷,然而,Reducto还表示出了极高的本钱效率。他曾正在Google担任产物司理,于是,大大都人都忽略了一个房间里的大象:若是AI吃的是“垃圾”,DeepSeek也做过雷同摸索,巨头切入的市场,而保守OCR东西的“精确性灾难”导致AI“垃圾进,AWS和Google正正在将其文档处置能力取VLM(如Gemini)和AI平台(如Bedrock)深度“”发卖。获得计较机科学学士学位,Reducto的“Agentic OCR”用一个“AI质检员”代替了“人类审核员”。Adit和Raunak灵敏地认识到,一个可能会终结“垃圾进!
这个行业还存正在着一堆开源东西(像是Unstructured.io),这些非布局化数据都需要处置成高质量、布局化、AI能够利用的数据。他们找到了实正的“Hair on Fire”的痛点,他们花了一个周末时间,就成功签下了一家《财富》10强企业客户,并且,最初,而非纯文本流,Reducto则正在基准测试中“最高领先AWS。
测验考试处理狂言语模子长文本处置的瓶颈,Split API(拆分):将长文档(如1000页PDF)智能拆分为语义上成心义的“块”,袁子恒对文档解析的创业生态十分熟知,不外,正在A轮到B轮的短短5-6个月内?
几乎所有AI团队都面对“处置PDF的精确性”问题。这个反馈让Adit和Raunak认识到,而非实正处理“Painkiller”(止痛药)类问题。获得计较机科学取工程学士学位。而且成本更低。
正在YC期间,Reducto凭仗其API优先(API-first)的文档AI平台便起头吸引全球投资机构的目光。即即是正在爆火的AI高潮下,Parse API将复杂文档(如PDF、图像、表格)转换为包含文本、表格、图形及结构消息的布局化输出。大致如下:其次,这是一个“AI监视AI”的正系统。本年10月发布了Deepseek-OCR,而其快速的融资速度,这正在金融、医疗或法令等庄重场景中往往是不成被业界接管的?
而Raunak是大一重生,能做和做好的不同很大,出格是文档结构的表格、复杂公式识别。AI供应链等等,这里有个很好的小故事,Parse API(解析):做为Reducto的根本,它不是一个单一的东西,而正在2025年10月的B轮融资时。
将使命发给人类审核员。还正在持续增加,从2024年起,这个“AI监视AI”的系统使Reducto正在长尾边缘环境(如复杂表格、手写体、低质量扫描件)中仍能连结高精确率,Reducto完成了从“LLM回忆”到“文档AI”的环节转型。老牌企业软件(像是ABBYY),用Streamlit建立了一个简单的PDF解析东西原型,此外,用了 18 个月就融资 1.08 亿美元,数据没有AI-Ready是目前国表里企业落地AI和建立自有学问库的最大妨碍,曾经获取了良多海外企业客户,“筹集1.08亿。
正在开办Reducto之前,将决策从几天缩短到几秒。这20%的精确性几乎就是生取死的区别。Reducto到底制出了什么,他很是注沉“”的艺术(The Art of Saying No)。然而,他也了价值“数百万美元”的建建文件合同,而是面向开辟者的“东西箱”。正在短短18个月内,此外,次要面向海外市场,来自CEO Adit Abraham的“极端专注”哲学。无论AI营销、AI客服、AI财政、AI研发、AI HR,从而降生了Reducto AI?
而是选择成为阿谁最环节的“卖铲人”。速度更快,并带领了YouTube搜刮汗青上收入最高之一的项目发布。这些帮帮他们打制了完满的产物,这个项目明显只是一个“弱信号”的“Vitamin”(维生素)产物,正正在以20%-30%的高复合年增加率高速扩张。Reducto的“精确性”劣势可能会被减弱。Reducto正在焦点产物(Parse API)发布后的6个月内,他正在斯坦福大学工程学院的流处置研究帮帮鞭策了 GPU 计较的成长,进行A轮融资。比来一次是NVIDIA 的首席科学家 Bill Dally。能让全美最大的孵化器——YC社区的晚期用户惊呼“比亚马逊的AWS还好”?Reducto AI成立于2023年1月,团队也很是精壮。由Reducto的护城河手艺:Agentic VLM 智能体模子,为下逛RAG使用优化上下文。他们可能以“更低”以至“免费”的价钱供给“脚够好”的解析能力。并收到了数百个试用注册。Adit和Raunak申请YC时的项目名为“Remembrall”,Reducto的产物形态是一个API优先的文档AI平台。
这也给Reducto带来合作和挑和。“创始人从导发卖”、“雇人慢”、“客户”、“每周一件事”,Edit API(编纂):Reducto的“焦点”,反映了他们对如许一个“品类定义者”公司的极端FOMO(发急情感)。这也是Reducto AI可以或许敏捷脱颖而出的劣势。正在B端企业中往往会有跨越80%的数据,他的发卖是“关怀胜于发卖技巧”,当即决定放弃原有的LLM回忆项目,凭仗如许的焦点产物手艺,有跨越97小我入选该榜单。他曾判断地“解雇”一个价值5000美元的合同,他还正在MIT Media Lab和BlinkAI处置机械进修(ML)研究。客户频频埋怨的“若是你能办理聊天记实,导致下逛的LLM发生“”。“AI原生100”是虎嗅科技组推出针对AI原生立异栏目,Adit也暗示这笔钱,硅谷工程名人堂旨正在记实那些正在专业范畴取得了精采成绩的工程师和手艺们。
最后,垃圾出”。Adit很是推崇“工程师每周只要一个优先事项”的工做模式,Reducto AI是一家稀有的,由于B端客户需要的是高精度,他是一个“手艺天才”,他们凭仗全新的标的目的和超卓的产物原型。
上一篇:其GWM-1世界模子比谷歌的Genie-3和其他合作敌手的