확장 가이드

개요

FIM One은 교체 가능한 각 구성 요소마다 하나씩 얇은 추상 기본 클래스 집합을 중심으로 구축되었습니다. 모든 구성 요소는 단일 책임과 최소한의 인터페이스를 가집니다. 추상 메서드를 구현하고, 인스턴스를 적절한 레지스트리 또는 인젝터에 연결하면, 나머지 시스템이 자동으로 구현을 사용합니다.

확장 지점	기본 클래스	파일	등록
LLM 제공자	`BaseLLM`	`core/model/base.py`	`ModelRegistry.register()`
도구	`BaseTool`	`core/tool/base.py`	`builtin/`에 파일 드롭
메모리	`BaseMemory`	`core/memory/base.py`	생성자 주입
임베딩	`BaseEmbedding`	`core/embedding/base.py`	생성자 주입
이미지 생성	`BaseImageGen`	`core/image_gen/base.py`	생성자 주입
리랭커	`BaseReranker`	`core/reranker/base.py`	생성자 주입
웹 페치 백엔드	`BaseWebFetch`	`core/web/fetch/base.py`	생성자 주입
웹 검색 백엔드	`BaseWebSearch`	`core/web/search/base.py`	생성자 주입
RAG 리트리버	`BaseRetriever`	`rag/base.py`	생성자 주입
문서 로더	`BaseLoader`	`rag/loaders/base.py`	로더 레지스트리 / 주입
텍스트 청킹	`BaseChunker`	`rag/chunking/base.py`	생성자 주입

사용자 정의 LLM 제공자

BaseLLM에는 두 가지 필수 메서드인 chat과 stream_chat, 그리고 모델이 수행할 수 있는 작업을 시스템의 나머지 부분에 알려주는 선택적 abilities 속성이 있습니다.

from collections.abc import AsyncIterator
from typing import Any

from fim_one.core.model.base import BaseLLM
from fim_one.core.model.types import ChatMessage, LLMResult, StreamChunk


class MyLLM(BaseLLM):
    def __init__(self, api_key: str, model: str) -> None:
        self._api_key = api_key
        self._model = model

    @property
    def model_id(self) -> str:
        return self._model

    @property
    def abilities(self) -> dict[str, bool]:
        return {
            "tool_call": True,   # supports native function calling
            "json_mode": True,   # supports response_format JSON mode
            "vision":   False,
            "streaming": True,
        }

    async def chat(
        self,
        messages: list[ChatMessage],
        *,
        tools: list[dict[str, Any]] | None = None,
        tool_choice: str | dict[str, Any] | None = None,
        temperature: float | None = None,
        max_tokens: int | None = None,
        response_format: dict[str, Any] | None = None,
    ) -> LLMResult:
        # Call your provider, return LLMResult(message=..., usage=...)
        ...

    async def stream_chat(
        self,
        messages: list[ChatMessage],
        *,
        tools: list[dict[str, Any]] | None = None,
        tool_choice: str | dict[str, Any] | None = None,
        temperature: float | None = None,
        max_tokens: int | None = None,
    ) -> AsyncIterator[StreamChunk]:
        # Yield StreamChunk instances as tokens arrive
        ...
        yield  # make type-checker happy

ModelRegistry를 통한 등록

ModelRegistry는 이름을 BaseLLM 인스턴스에 매핑하고 역할별로 해결합니다. 시스템은 네 가지 기본 제공 역할을 사용합니다: general, fast, compact, 및 vision. 자신만의 역할을 추가할 수 있습니다.

from fim_one.core.model.registry import ModelRegistry

registry = ModelRegistry()
registry.register("my-llm", MyLLM(api_key="...", model="my-v1"), roles=["general"])
registry.register("my-fast", MyLLM(api_key="...", model="my-mini"), roles=["fast", "compact"])

# Retrieve later
llm = registry.get_default()           # first "general" model, or first registered
llm = registry.get_by_role("fast")     # first model with the "fast" role
llm = registry.get("my-llm")           # by exact name

abilities 딕셔너리는 LLM과 ReAct 엔진 간의 계약입니다. tool_call=True이고 에이전트가 use_native_tools=True로 생성된 경우, 엔진은 네이티브 함수 호출을 사용합니다. 그렇지 않으면 자동으로 JSON 모드로 폴백됩니다.

사용자 정의 도구

도구는 가장 일반적인 확장입니다. BaseTool에는 세 가지 필수 요소가 있습니다: name, description, 그리고 run. 나머지는 모두 합리적인 기본값을 가지고 있습니다.

from typing import Any
from fim_one.core.tool.base import BaseTool


class GitStatusTool(BaseTool):
    @property
    def name(self) -> str:
        return "git_status"

    @property
    def description(self) -> str:
        return "Return the current git status of a repository."

    @property
    def category(self) -> str:
        return "filesystem"   # groups the tool in the UI

    @property
    def parameters_schema(self) -> dict[str, Any]:
        return {
            "type": "object",
            "properties": {
                "path": {
                    "type": "string",
                    "description": "Absolute path to the repository root.",
                }
            },
            "required": ["path"],
        }

    async def run(self, *, path: str, **kwargs: Any) -> str:
        import asyncio
        result = await asyncio.create_subprocess_shell(
            f"git -C {path} status --short",
            stdout=asyncio.subprocess.PIPE,
            stderr=asyncio.subprocess.PIPE,
        )
        stdout, _ = await result.communicate()
        return stdout.decode()

자동 발견

src/fim_one/core/tool/builtin/ 디렉토리에 파일을 드롭하면 됩니다. discover_builtin_tools() 스캐너가 구체적인(추상이 아닌) BaseTool 서브클래스를 자동으로 찾습니다 — 수동 등록이 필요하지 않습니다.

src/fim_one/core/tool/builtin/
├── calculator.py       ← existing tool
├── git_status.py       ← your new file → auto-discovered
└── ...

스캐너는 _SKIP_AUTO_DISCOVER에 나열된 클래스를 건너뜁니다. 외부 구성(예: API 키)이 필요하고 시작 시 조건부로 인스턴스화해야 하는 도구에 해당 집합을 사용하세요.

사용 불가능 신호 전송

종속성이 누락되었을 때 도구 카탈로그에 메시지를 표시하려면 availability()를 재정의하세요:

def availability(self) -> tuple[bool, str | None]:
    import os
    if not os.getenv("GITHUB_TOKEN"):
        return False, "GITHUB_TOKEN environment variable is not set."
    return True, None

아티팩트를 포함한 풍부한 결과

도구가 파일을 생성할 때 일반 str 대신 ToolResult를 반환하세요:

from fim_one.core.tool.base import Artifact, ToolResult

async def run(self, **kwargs: Any) -> ToolResult:
    # ... produce a file at /tmp/report.html ...
    return ToolResult(
        content="Report generated.",
        content_type="text",
        artifacts=[Artifact(name="report.html", path="/uploads/report.html", mime_type="text/html", size=4096)],
    )

사용자 정의 메모리

BaseMemory는 대화 기록의 지속성 계층입니다. 세 가지 메서드: add_message, get_messages, clear.

import redis.asyncio as redis
from fim_one.core.memory.base import BaseMemory
from fim_one.core.model.types import ChatMessage


class RedisMemory(BaseMemory):
    def __init__(self, conversation_id: str, redis_url: str) -> None:
        self._key = f"conv:{conversation_id}"
        self._redis = redis.from_url(redis_url)

    async def add_message(self, message: ChatMessage) -> None:
        import json
        await self._redis.rpush(self._key, json.dumps(message))

    async def get_messages(self) -> list[ChatMessage]:
        import json
        raw = await self._redis.lrange(self._key, 0, -1)
        return [json.loads(m) for m in raw]

    async def clear(self) -> None:
        await self._redis.delete(self._key)

에이전트 생성자를 통해 주입: ReActAgent(llm=llm, memory=RedisMemory(conv_id, url)).

사용자 정의 임베딩

BaseEmbedding은 두 가지 메서드를 제공합니다: embed_texts (배치) 및 embed_query (단일), 그리고 dimension 속성입니다.

from fim_one.core.embedding.base import BaseEmbedding


class MyEmbedding(BaseEmbedding):
    def __init__(self, model: str) -> None:
        self._model = model
        self._dim = 1536

    @property
    def dimension(self) -> int:
        return self._dim

    async def embed_texts(self, texts: list[str]) -> list[list[float]]:
        # Batch embed documents
        ...

    async def embed_query(self, query: str) -> list[float]:
        # Embed a single query — often uses a different instruction prefix
        ...

embed_texts와 embed_query 간의 구분이 존재하는 이유는 많은 임베딩 모델(예: E5, BGE)이 검색 품질을 개선하기 위해 문서와 쿼리에 대해 서로 다른 접두사를 사용하기 때문입니다.

사용자 정의 이미지 생성

BaseImageGen은 단일 메서드 generate를 가지고 있습니다. 이미지를 output_dir에 저장하고 파일 경로와 서버 상대 URL이 포함된 ImageResult를 반환합니다.

from fim_one.core.image_gen.base import BaseImageGen, ImageResult


class StableDiffusionImageGen(BaseImageGen):
    async def generate(
        self,
        prompt: str,
        *,
        aspect_ratio: str = "1:1",
        output_dir: str,
    ) -> ImageResult:
        # Call your SD API, save to output_dir
        file_path = f"{output_dir}/image.png"
        return ImageResult(
            file_path=file_path,
            url=f"/uploads/{file_path.split('/')[-1]}",
            prompt=prompt,
            model="stable-diffusion-xl",
        )

커스텀 리랭커

BaseReranker는 쿼리와 문서 문자열 목록을 받아 재정렬된 문서를 점수와 함께 반환합니다.

from fim_one.core.reranker.base import BaseReranker, RerankResult


class CrossEncoderReranker(BaseReranker):
    async def rerank(
        self, query: str, documents: list[str], *, top_k: int = 5
    ) -> list[RerankResult]:
        # Score each (query, doc) pair with a cross-encoder
        scores = await self._score_pairs(query, documents)
        results = [
            RerankResult(index=i, score=score, text=doc)
            for i, (doc, score) in enumerate(zip(documents, scores))
        ]
        results.sort(key=lambda r: r.score, reverse=True)
        return results[:top_k]

사용자 정의 웹 백엔드

웹 가져오기

BaseWebFetch는 URL을 가져오고 해당 콘텐츠를 Markdown 또는 일반 텍스트로 반환합니다.

from fim_one.core.web.fetch.base import BaseWebFetch


class PlaywrightFetch(BaseWebFetch):
    async def fetch(self, url: str) -> str:
        # Use Playwright to render JS-heavy pages
        async with async_playwright() as p:
            browser = await p.chromium.launch()
            page = await browser.new_page()
            await page.goto(url)
            content = await page.content()
            await browser.close()
        return html_to_markdown(content)

웹 검색

BaseWebSearch는 순위가 지정된 SearchResult 객체 목록을 반환합니다.

from fim_one.core.web.search.base import BaseWebSearch, SearchResult


class BingSearch(BaseWebSearch):
    async def search(self, query: str, *, num_results: int = 10) -> list[SearchResult]:
        # Call Bing Search API
        ...
        return [
            SearchResult(title=r["name"], url=r["url"], snippet=r["snippet"])
            for r in raw_results[:num_results]
        ]

커스텀 RAG 컴포넌트

RAG 파이프라인은 세 가지 독립적으로 교체 가능한 단계를 가지고 있습니다: 로딩, 청킹, 검색.

문서 로더

BaseLoader는 파일 경로를 LoadedDocument 객체의 목록으로 변환합니다. PDF 로더는 일반적으로 페이지당 하나의 문서를 반환합니다.

from pathlib import Path
from fim_one.rag.loaders.base import BaseLoader, LoadedDocument


class DocxLoader(BaseLoader):
    async def load(self, path: Path) -> list[LoadedDocument]:
        from docx import Document
        doc = Document(path)
        text = "\n".join(p.text for p in doc.paragraphs)
        return [LoadedDocument(content=text, metadata={"source": str(path)})]

텍스트 청커

BaseChunker는 텍스트를 Chunk 객체로 분할합니다. MAX_CHUNK_SIZE = 6000 문자는 하드 상한선입니다 — 이 크기를 초과하는 청크는 Jina Embeddings v3 토큰 윈도우를 오버플로우할 수 있습니다.

from typing import Any
from fim_one.rag.chunking.base import BaseChunker, Chunk


class SentenceChunker(BaseChunker):
    def __init__(self, sentences_per_chunk: int = 5) -> None:
        self._n = sentences_per_chunk

    async def chunk(self, text: str, metadata: dict[str, Any] | None = None) -> list[Chunk]:
        import nltk
        sentences = nltk.sent_tokenize(text)
        chunks = []
        for i in range(0, len(sentences), self._n):
            chunk_text = " ".join(sentences[i : i + self._n])
            chunks.append(Chunk(text=chunk_text, metadata=metadata or {}, index=i // self._n))
        return chunks

검색기

BaseRetriever는 모든 백엔드를 쿼리하고 순위가 지정된 Document 객체를 반환합니다.

from fim_one.rag.base import BaseRetriever, Document


class ElasticsearchRetriever(BaseRetriever):
    def __init__(self, es_client, index: str) -> None:
        self._es = es_client
        self._index = index

    async def retrieve(self, query: str, *, top_k: int = 5) -> list[Document]:
        resp = await self._es.search(
            index=self._index,
            query={"match": {"content": query}},
            size=top_k,
        )
        return [
            Document(
                content=hit["_source"]["content"],
                metadata=hit["_source"].get("metadata", {}),
                score=hit["_score"],
            )
            for hit in resp["hits"]["hits"]
        ]

설계 원칙

모든 기본 클래스에서 일관된 몇 가지 패턴이 있어서 사용자 정의 구현을 올바르게 작성하기가 더 쉬워집니다: 비동기 우선. 모든 메서드는 async def입니다. 구현이 동기식이더라도 asyncio.to_thread()로 래핑하여 이벤트 루프를 차단하지 않도록 합니다. 도구의 문자열 출력. BaseTool.run()은 str (또는 ToolResult)을 반환합니다. LLM은 텍스트만 봅니다 — 도구 구현은 복잡한 데이터를 읽을 수 있는 형식으로 직렬화할 책임이 있습니다. 최소 인터페이스. 각 기본 클래스는 필요한 가장 작은 계약을 정의합니다. BaseMemory는 세 가지 메서드이고, BaseWebFetch는 하나입니다. 필요하지 않은 기능을 구현할 필요가 없습니다. 상속보다 구성. 기본 클래스는 인터페이스이지 프레임워크가 아닙니다. 구성 시점에 구현을 주입하고, 런타임은 절대 monkey-patch하거나 추가로 서브클래싱하지 않습니다.

왜 FIM One인가

시작하기

구성

통합

기능

FIM One 확장

확장 가이드

개요

사용자 정의 LLM 제공자

ModelRegistry를 통한 등록

사용자 정의 도구

자동 발견

사용 불가능 신호 전송

아티팩트를 포함한 풍부한 결과

사용자 정의 메모리

사용자 정의 임베딩

사용자 정의 이미지 생성

커스텀 리랭커

사용자 정의 웹 백엔드

웹 가져오기

웹 검색

커스텀 RAG 컴포넌트

문서 로더

텍스트 청커

검색기

설계 원칙

왜 FIM One인가

시작하기

구성

통합

기능

FIM One 확장

Documentation Index

​개요

​사용자 정의 LLM 제공자

​ModelRegistry를 통한 등록

​사용자 정의 도구

​자동 발견

​사용 불가능 신호 전송

​아티팩트를 포함한 풍부한 결과

​사용자 정의 메모리

​사용자 정의 임베딩

​사용자 정의 이미지 생성

​커스텀 리랭커

​사용자 정의 웹 백엔드

​웹 가져오기

​웹 검색

​커스텀 RAG 컴포넌트

​문서 로더

​텍스트 청커

​검색기

​설계 원칙

개요

사용자 정의 LLM 제공자

ModelRegistry를 통한 등록

사용자 정의 도구

자동 발견

사용 불가능 신호 전송

아티팩트를 포함한 풍부한 결과

사용자 정의 메모리

사용자 정의 임베딩

사용자 정의 이미지 생성

커스텀 리랭커

사용자 정의 웹 백엔드

웹 가져오기

웹 검색

커스텀 RAG 컴포넌트

문서 로더

텍스트 청커

검색기

설계 원칙