OpenClaw: suspicious
VirusTotal: benign
StaticScan: clean
OpenClaw: suspicious
The skill's code and instructions broadly match an offline OCR tool, but several clear inconsistencies (claims of 'fully offline' / 'no network' vs. pip install and a first-run model download, plus sm... [内容已截断]
VirusTotal: benign VT 报告
静态扫描: clean
No suspicious patterns detected.
README 未提供
无文件信息
{
"latestVersion": {
"_creationTime": 1773368067219,
"_id": "k97a4cp3xveajtxdgb1xpq0j7s82tmy8",
"changelog": "# FastOCR - 专业票据 OCR 识别工具\n\n## 📋 描述\n\n**FastOCR** 是一款专业的票据 OCR 识别工具,支持增值税发票、火车票、飞机票、出租车票等各类票据的高精度识别。\n\n基于 ONNX 推理引擎,无需深度学习框架,轻量快速,完全离线运行。\n\n### 🛡️ 安全承诺\n\n- ✅ **完全离线运行** - 不发送任何数据到外部服务器\n- ✅ **无动态代码执行** - 不使用 `exec()`、`eval()` 等危险函数\n- ✅ **无网络请求** - 不访问任何网络资源(除了首次下载 OCR 模型)\n- ✅ **无系统命令** - 不调用 `os.system()`、`subprocess` 等\n- ✅ **开源透明** - 所有代码可见,无隐藏逻辑\n- ✅ **MIT 许可证** - 免费开源,可自由使用和审计\n\n---\n\n### 🎯 核心功能\n\n- 📄 **增值税发票识别** - 自动提取税号、金额、日期、公司名称等 30+ 字段\n- 🚄 **火车票识别** - 提取车次、座位号、票价、乘车日期、出发\/到达站等信息\n- ✈️ **飞机票识别** - 提取航班号、舱位、票价、乘机人等信息\n- 🚕 **出租车票识别** - 提取车牌号、金额、时间、起止地点等信息\n- 🖼️ **通用文字识别** - 支持中英文混合高精度识别\n- 📑 **批量处理** - 一次性识别多张票据,自动整理输出\n\n---\n\n## 🎯 使用场景\n\n### 💼 财务报销场景\n\n**增值税发票识别**\n- 自动提取购买方\/销售方纳税人识别号\n- 提取价税合计、税额、不含税金额\n- 提取开票日期、发票代码、发票号码\n- 提取公司名称、地址电话、开户行信息\n- 提取商品明细、规格型号、数量、单价\n\n**典型用户**: 财务人员、会计、出纳、报销专员\n\n**效率提升**: \n- 手动录入:3-5 分钟\/张\n- OCR 识别:10 秒\/张\n- **效率提升 95%+**\n\n---\n\n### 📊 企业票据管理\n\n**批量票据处理**\n- 批量识别员工提交的报销票据\n- 自动整理票据信息到 Excel\/CSV\n- 自动校验税号格式、金额逻辑\n- 快速筛查重复票据、异常票据\n\n**典型用户**: 中小企业、创业公司、财务部门\n\n**成本节省**:\n- 减少人工录入错误\n- 降低财务人力成本\n- 加快报销审批流程\n\n---\n\n### 🚄 差旅管理场景\n\n**交通票据识别**\n- 火车票:车次、座位、票价、乘车人\n- 飞机票:航班号、舱位、票价、乘机人\n- 出租车票:车牌号、金额、时间、路线\n- 汽车票:班次、时间、票价、始发站\n\n**典型用户**: 行政人员、差旅管理员、HR\n\n**管理价值**:\n- 自动统计差旅费用\n- 快速核对出差行程\n- 生成差旅费用报表\n\n---\n\n### 🏥 医疗票据场景\n\n**医疗发票识别**\n- 提取医院名称、发票代码、发票号码\n- 提取金额、医保支付、自费金额\n- 提取就诊日期、科室、药品明细\n\n**典型用户**: 保险公司、医疗机构、个人用户\n\n**应用价值**:\n- 快速理赔审核\n- 医疗费用统计\n- 医保报销辅助\n\n---\n\n### 🛒 零售小票场景\n\n**购物小票识别**\n- 提取商家名称、购物日期、总金额\n- 提取商品清单、单价、数量\n- 提取支付方式、会员积分\n\n**典型用户**: 市场调研、消费者、记账用户\n\n**数据分析**:\n- 消费习惯分析\n- 商品价格对比\n- 市场调研数据采集\n\n---\n\n### 📸 日常使用场景\n\n**通用文字识别**\n- 截图文字提取(复制图片中的文字)\n- 文档扫描识别(将扫描件转为可编辑文本)\n- 拍照识字(识别照片中的文字)\n- 名片信息识别(提取姓名、电话、公司)\n\n**典型用户**: 学生、办公人员、研究人员\n\n**效率工具**:\n- 快速整理笔记\n- 提取文档内容\n- 数字化纸质资料\n\n---\n\n## 🔍 常见搜索词\n\n用户可能会搜索:\n- \"OCR\"、\"文字识别\"、\"图片转文字\"\n- \"发票识别\"、\"税号识别\"、\"票据识别\"\n- \"火车票识别\"、\"高铁票识别\"、\"动车票识别\"\n- \"财务报销\"、\"票据管理\"、\"批量识别\"\n- \"截图识别\"、\"文档扫描\"、\"拍照识字\"\n\n---\n\n## 📊 支持的票据类型\n\n### 税务票据\n- ✅ 增值税专用发票\n- ✅ 增值税普通发票\n- ✅ 增值税电子发票\n- ✅ 区块链电子发票\n- ✅ 全电发票(全面数字化电子发票)\n- ✅ 机动车销售统一发票\n- ✅ 二手车销售统一发票\n\n### 交通票据\n- ✅ 火车票(纸质\/电子\/高铁\/动车\/普速)\n- ✅ 飞机行程单\n- ✅ 出租车票\n- ✅ 汽车票\n- ✅ 船票\n\n### 医疗票据\n- ✅ 医疗门诊发票\n- ✅ 医疗住院发票\n- ✅ 药店购药发票\n\n### 其他票据\n- ✅ 定额发票\n- ✅ 过路过桥费发票\n- ✅ 停车费发票\n- ✅ 加油发票\n- ✅ 零售小票\n\n---\n\n## 📦 依赖要求\n\n- Python >= 3.8\n- rapidocr-onnxruntime >= 1.2.3\n- Windows \/ macOS \/ Linux\n\n---\n\n## 🚀 快速开始\n\n### 安装依赖\n```bash\npip install rapidocr-onnxruntime\n```\n\n### 使用示例\n\n#### 1. 识别增值税发票\n```\n用户:识别这张发票\n助手:call 票据识别 invoice.jpg\n\n输出:\n{\n \"invoice_type\": \"增值税专用发票\",\n \"invoice_code\": \"3200153160\",\n \"invoice_number\": \"00362801\",\n \"invoice_date\": \"2016 年 04 月 26 日\",\n \"buyer_tax_id\": \"110101251328321\",\n \"seller_tax_id\": \"32040700DKD0337\",\n \"amount_with_tax\": 20000.00,\n \"tax_amount\": 2905.98,\n \"tax_rate\": \"17%\"\n}\n```\n\n#### 2. 识别火车票\n```\n用户:识别这张火车票\n助手:call 火车票识别 train_ticket.jpg\n\n输出:\n{\n \"ticket_type\": \"火车票\",\n \"ticket_number\": \"A002572\",\n \"train_number\": \"C2275\",\n \"from_station\": \"北京南\",\n \"to_station\": \"天津\",\n \"datetime\": \"2008 年 08 月 22 日 12:35 开\",\n \"seat_class\": \"一等座\",\n \"carriage\": \"05 车\",\n \"seat_number\": \"009 号\",\n \"price\": 69.00\n}\n```\n\n#### 3. 文字识别\n```\n用户:把这张截图的文字提取出来\n助手:call 文字识别 screenshot.png\n\n输出:\n完整识别文本...\n```\n\n#### 4. 批量识别\n```\n用户:批量识别这些发票\n助手:call 批量识别 .\/invoices\/ output.txt\n\n输出:\n已识别 15 张图片,文字已保存到 output.txt\n```\n\n---\n\n## 📝 输出格式\n\n### 发票识别输出(结构化)\n```json\n{\n \"success\": true,\n \"invoice_basic\": {\n \"invoice_code\": \"3200153160\",\n \"invoice_number\": \"00362801\",\n \"invoice_date\": \"2016 年 04 月 26 日\",\n \"invoice_type\": \"增值税专用发票\",\n \"check_code\": \"12345678901234567890\"\n },\n \"buyer\": {\n \"name\": \"北京 XXX 公司\",\n \"tax_id\": \"91110108MA01G7XQ6K\",\n \"address_phone\": \"北京市海淀区 XXX 路 XXX 号 010-12345678\",\n \"bank\": \"工商银行北京分行 XXX 支行 1234567890123456789\"\n },\n \"seller\": {\n \"name\": \"江苏 XXX 公司\",\n \"tax_id\": \"91320000MA1K3YJQ9E\",\n \"address_phone\": \"江苏省南京市 XXX 路 XXX 号 025-87654321\",\n \"bank\": \"建设银行南京分行 XXX 支行 9876543210987654321\"\n },\n \"amount\": {\n \"amount_without_tax\": 17094.02,\n \"tax_amount\": 2905.98,\n \"amount_with_tax\": 20000.00,\n \"tax_rate\": \"17%\"\n },\n \"other\": {\n \"payee\": \"张三\",\n \"reviewer\": \"李四\",\n \"drawer\": \"王五\",\n \"remark\": \"备注信息\"\n }\n}\n```\n\n### 火车票识别输出(结构化)\n```json\n{\n \"success\": true,\n \"ticket_type\": \"火车票\",\n \"ticket_basic\": {\n \"ticket_number\": \"A002572\",\n \"train_number\": \"C2275\",\n \"datetime\": \"2008 年 08 月 22 日 12:35 开\",\n \"train_model\": \"和谐号\"\n },\n \"journey\": {\n \"from_station\": \"北京南\",\n \"to_station\": \"天津\"\n },\n \"seat\": {\n \"seat_class\": \"一等座\",\n \"carriage\": \"05 车\",\n \"seat_number\": \"009 号\"\n },\n \"price\": {\n \"amount\": 69.00\n }\n}\n```\n\n### 基础识别输出\n```json\n{\n \"success\": true,\n \"image_path\": \"xxx.jpg\",\n \"full_text\": \"完整识别文本...\",\n \"lines\": [\n {\"text\": \"第一行文字\", \"confidence\": 0.95},\n {\"text\": \"第二行文字\", \"confidence\": 0.87}\n ],\n \"elapsed_ms\": 234\n}\n```\n\n---\n\n## 📊 性能参考\n\n| 票据类型 | 字段提取率 | 识别时间 | 准确率 |\n|----------|------------|----------|--------|\n| 增值税发票 | 83%+ | ~500ms | 90%+ |\n| 火车票 | 100% | ~400ms | 95%+ |\n| 飞机票 | 85%+ | ~450ms | 90%+ |\n| 出租车票 | 80%+ | ~300ms | 85%+ |\n| 通用文字 | 95%+ | ~300ms | 95%+ |\n\n**注**: 实际识别率受图片质量、光线、角度等因素影响\n\n---\n\n## ⚙️ 配置选项\n\n### 环境变量(可选)\n```bash\n# 自定义模型路径\nRAPIDOCR_MODEL_PATH=\/path\/to\/models\n\n# 是否使用 GPU 加速(需要 onnxruntime-gpu)\nRAPIDOCR_USE_GPU=false\n\n# 置信度阈值(低于此值的识别结果会被标记)\nRAPIDOCR_CONFIDENCE_THRESHOLD=0.6\n```\n\n---\n\n## 🛠️ 故障处理\n\n### 问题 1:识别结果为空\n- 检查图片路径是否正确\n- 确认图片格式支持(JPG\/PNG\/BMP\/GIF\/WebP)\n- 检查图片是否过于模糊\n\n### 问题 2:税号识别不准确\n- 确认税号区域清晰可见\n- 检查是否有遮挡、污损\n- 尝试调整图片亮度\/对比度\n\n### 问题 3:金额识别错误\n- 检查小数点是否清晰\n- 确认金额区域无遮挡\n- 当前版本对模糊小数点支持有限(v1.2.0 优化)\n\n### 问题 4:识别速度慢\n- 首次运行会下载模型(约 100MB)\n- 后续运行速度正常(~500ms\/张)\n- 可使用 GPU 加速(需安装 onnxruntime-gpu)\n\n---\n\n## 📋 版本历史\n\n### v1.1.0 (2026-03-13)\n- ✅ 新增火车票识别功能\n- ✅ 支持 50+ 个车站中英文映射\n- ✅ 火车票识别率 100%\n- ✅ 优化发票税号识别(修复 17 位税号问题)\n- ✅ 添加安全声明和代码注释\n\n### v1.0.0 (2026-03-12)\n- ✅ 初始版本发布\n- ✅ 支持增值税发票识别\n- ✅ 支持批量处理\n- ✅ 结构化输出 30+ 字段\n- ✅ 数据验证功能\n\n---\n\n## 🔒 隐私说明\n\n- ✅ **完全离线运行** - 图片不上传云端\n- ✅ **本地处理** - 数据保存在本地\n- ✅ **无数据收集** - 不收集用户信息\n- ✅ **开源透明** - 代码完全开源\n\n---\n\n## 📞 技术支持\n\n- 文档:https:\/\/docs.openclaw.ai\/skills\/fast-ocr\n- GitHub: https:\/\/github.com\/openclaw\/openclaw\n- 问题反馈:https:\/\/github.com\/openclaw\/openclaw\/issues\n- ClawHub: https:\/\/clawhub.ai\/skills\/fast-ocr\n\n---\n\n## 📄 许可证\n\nMIT License\n\n---",
"changelogSource": "user",
"createdAt": 1773368067219,
"version": "1.0.2"
},
"owner": {
"_creationTime": 0,
"_id": "publishers:missing",
"displayName": "gaojiren",
"handle": "gaojiren",
"image": "https:\/\/avatars.githubusercontent.com\/u\/2235829?v=4",
"kind": "user",
"linkedUserId": "kn7arfewdb0k7ft0vp7g3a51s182r1xf"
},
"ownerHandle": "gaojiren",
"skill": {
"_creationTime": 1773333925419,
"_id": "kd76vek7hvs3nhna5bhsvn828182sqgy",
"badges": [],
"createdAt": 1773333925419,
"displayName": "fast-ocr",
"latestVersionId": "k97a4cp3xveajtxdgb1xpq0j7s82tmy8",
"ownerUserId": "kn7arfewdb0k7ft0vp7g3a51s182r1xf",
"slug": "fast-ocr",
"stats": {
"comments": 0,
"downloads": 220,
"installsAllTime": 0,
"installsCurrent": 0,
"stars": 0,
"versions": 3
},
"summary": "专业离线票据OCR,支持增值税发票、火车票、飞机票、出租车票等多种票据的高精度结构化识别与批量处理。",
"tags": {
"latest": "k97a4cp3xveajtxdgb1xpq0j7s82tmy8"
},
"updatedAt": 1774332610780
}
}