← Back to list

ocr-service
by Lin-A1
根据agent skill理念构建的通用智能体框架
⭐ 2🍴 0📅 Jan 15, 2026
SKILL.md
name: ocr-service description: 高精度光学字符识别(OCR)服务。支持多语言、多格式图像的文字检测与提取,并提供文本区域坐标与置信度评分,适用于文档数字化与图像内容分析。
功能
从图像中提取文字内容,支持多种图像格式和语言。
调用方式
from services.ocr_service.client import OCRServiceClient
client = OCRServiceClient()
# 健康检查
status = client.health_check()
# OCR识别
image_base64 = client.image_to_base64("/path/to/image.jpg")
result = client.ocr(image_base64)
# 获取识别结果
texts = result["rec_texts"] # ["识别的文字1", "识别的文字2", ...]
scores = result["rec_scores"] # [0.98, 0.95, ...]
返回格式
{
"doc_preprocessor_res": {"angle": 0},
"dt_polys": [[x1,y1], [x2,y2], ...],
"rec_texts": ["识别的文字1", "识别的文字2"],
"rec_scores": [0.98, 0.95]
}
字段说明
rec_texts: 识别出的文字列表rec_scores: 每个文字块的置信度dt_polys: 检测到的文本区域坐标
Score
Total Score
55/100
Based on repository quality metrics
✓SKILL.md
SKILL.mdファイルが含まれている
+20
○LICENSE
ライセンスが設定されている
0/10
○説明文
100文字以上の説明がある
0/10
○人気
GitHub Stars 100以上
0/15
✓最近の活動
1ヶ月以内に更新
+10
○フォーク
10回以上フォークされている
0/5
✓Issue管理
オープンIssueが50未満
+5
✓言語
プログラミング言語が設定されている
+5
✓タグ
1つ以上のタグが設定されている
+5
Reviews
💬
Reviews coming soon
