吴恩达创业公司LandingAI,平均8秒就能完成超大份文档提取任务,已广泛应用

量子位来谈科技 2025-05-29 18:22:46

吴恩达创业公司LandingAI,平均8秒就能完成超大份文档提取任务,已广泛应用于医疗、金融、法律等行业场景。 例如,医疗平台Eolas Medical正在用它解析10万+份临床指南,为医生提供基于原始文档的知识问答;金融机构也在用它处理贷款材料和客户尽调流程。 再看视频演示中提到的案例: - 上传一份含有图表的PDF报告,几秒内转为结构化Markdown; - 复杂交通事故表单也能自动识别字段、图示和填写顺序; - 发票中包含的“发票号、开票日期、商品描述”等关键字段都能被自动提取。 智能文档提取(Agentic Document Extraction,ADE),做的事情远不止传统OCR的“识字”: - 图文混合精准提取:不仅识别文字,还能解析图表、表格、流程图、表单字段等内容,并保留原始文档的空间结构; - 视觉定位(Visual Grounding):每条提取的数据,都能精确追溯到原文件的坐标位置,适用于合规审计等需要可验证性的场景; - 智能读取顺序:哪怕是复杂的表单或发票,ADE也能推断正确的阅读顺序,不会把内容“读乱”; - Markdown输出:可直接生成结构清晰的Markdown格式文本,用于问答系统、结构化数据分析等下游任务; - 强适配性:无论是扫描件PDF、手绘图表,还是不规则的文档排版,都能直接解析,无需模板或额外训练; - 开发者友好:支持通过SDK和Python库快速集成,还提供Playground可视化工具方便调试和测试。 可以说,ADE 把文档从“死数据”变成了“活知识”,让AI真正读懂文档,并参与到后续的业务处理中去。对于需要大规模处理文档的企业来说,这项技术或许是提效的关键。 感兴趣的小伙伴可以点击:landing.ai/agentic-document-extraction

0 阅读:1
量子位来谈科技

量子位来谈科技

感谢大家的关注