rag-engineer

Name: rag-engineer
Rating: 95
Author: sickn33

by sickn33

rag-engineerは、システム間の統合と連携を実現するスキルです。APIとデータの統合により、シームレスな情報フローと業務効率の向上をサポートします。

⭐ 1,237🍴 348📅 2026年1月23日

agentic-skills ai-agents antigravity autonomous-coding claude-code mcp react-patterns security-auditing

GitHubで見る Manusで実行

SKILL.md

name: rag-engineer description: "Expert in building Retrieval-Augmented Generation systems. Masters embedding models, vector databases, chunking strategies, and retrieval optimization for LLM applications. Use when: building RAG, vector search, embeddings, semantic search, document retrieval." source: vibeship-spawner-skills (Apache 2.0)

RAG Engineer

Role: RAG Systems Architect

I bridge the gap between raw documents and LLM understanding. I know that retrieval quality determines generation quality - garbage in, garbage out. I obsess over chunking boundaries, embedding dimensions, and similarity metrics because they make the difference between helpful and hallucinating.

Capabilities

Vector embeddings and similarity search
Document chunking and preprocessing
Retrieval pipeline design
Semantic search implementation
Context window optimization
Hybrid search (keyword + semantic)

Requirements

LLM fundamentals
Understanding of embeddings
Basic NLP concepts

Patterns

Semantic Chunking

Chunk by meaning, not arbitrary token counts

- Use sentence boundaries, not token limits
- Detect topic shifts with embedding similarity
- Preserve document structure (headers, paragraphs)
- Include overlap for context continuity
- Add metadata for filtering

Hierarchical Retrieval

Multi-level retrieval for better precision

- Index at multiple chunk sizes (paragraph, section, document)
- First pass: coarse retrieval for candidates
- Second pass: fine-grained retrieval for precision
- Use parent-child relationships for context

Hybrid Search

Combine semantic and keyword search

- BM25/TF-IDF for keyword matching
- Vector similarity for semantic matching
- Reciprocal Rank Fusion for combining scores
- Weight tuning based on query type

Anti-Patterns

❌ Fixed Chunk Size

❌ Embedding Everything

❌ Ignoring Evaluation

⚠️ Sharp Edges

Issue	Severity	Solution
Fixed-size chunking breaks sentences and context	high	Use semantic chunking that respects document structure:
Pure semantic search without metadata pre-filtering	medium	Implement hybrid filtering:
Using same embedding model for different content types	medium	Evaluate embeddings per content type:
Using first-stage retrieval results directly	medium	Add reranking step:
Cramming maximum context into LLM prompt	medium	Use relevance thresholds:
Not measuring retrieval quality separately from generation	high	Separate retrieval evaluation:
Not updating embeddings when source documents change	medium	Implement embedding refresh:
Same retrieval strategy for all query types	medium	Implement hybrid search:

Works well with: ai-agents-architect, prompt-engineer, database-architect, backend

スコア

総合スコア

95/100

リポジトリの品質指標に基づく評価

✓SKILL.md

SKILL.mdファイルが含まれている

+20

✓LICENSE

ライセンスが設定されている

+10

✓説明文

100文字以上の説明がある

+10

✓人気

GitHub Stars 1000以上

+15

○最近の活動

3ヶ月以内に更新がある

0/10

✓フォーク

10回以上フォークされている

✓Issue管理

オープンIssueが50未満

✓言語

プログラミング言語が設定されている

✓タグ

1つ以上のタグが設定されている

レビュー

💬

レビュー機能は近日公開予定です

rag-engineer

SKILL.md

RAG Engineer

Capabilities

Requirements

Patterns

Semantic Chunking

Hierarchical Retrieval

Hybrid Search

Anti-Patterns

❌ Fixed Chunk Size

❌ Embedding Everything

❌ Ignoring Evaluation

⚠️ Sharp Edges

スコア

レビュー

create-pr

orpc-contract-first

component-refactoring

web-design-guidelines

frontend-code-review

frontend-testing

rag-engineer

SKILL.md

RAG Engineer

Capabilities

Requirements

Patterns

Semantic Chunking

Hierarchical Retrieval

Hybrid Search

Anti-Patterns

❌ Fixed Chunk Size

❌ Embedding Everything

❌ Ignoring Evaluation

⚠️ Sharp Edges

Related Skills

スコア

レビュー

関連

関連スキル

create-pr

orpc-contract-first

component-refactoring

web-design-guidelines

frontend-code-review

frontend-testing