Fact Explorer — Evidence-first 사실 탐색 플랫폼

EXTRACTION PIPELINE

7단계 AI 파이프라인 — 가상 예시로 이해하기

간단한 예시 문장으로 각 단계에서 어떤 일이 일어나는지 보여드립니다

📝 원본 입력 텍스트

○김민수 의원 존경하는 도민 여러분, 현재 우리 도의 청년 실업률은 12.5%로 전국 평균보다 높습니다. 저는 청년창업지원센터 설립 조례안을 발의하여 이 문제를 해결하고자 합니다. 도지사님의 입장을 묻겠습니다.

※ 이해를 위한 가상의 예시입니다

정규화Normalization

텍스트를 정리하고 분석 가능한 단위로 분할합니다

OUTPUT

{
  "normalizedText": "김민수 의원: 존경하는 도민 여러분, 현재 우리 도의 청년 실업률은 12.5%로...",
  "chunks": [
    { "index": 0, "content": "김민수 의원의 도정질문 발언", "charCount": 142 }
  ],
  "metadata": { "totalChars": 142, "totalChunks": 1, "language": "ko" }
}

💡 발화자 마커(○김민수 의원)를 인식하여 화자 정보를 보존합니다

▼

문서 분류Classification

문서의 유형, 카테고리, 핵심 키워드를 자동 판별합니다

OUTPUT

{
  "documentType": "회의록",
  "category": "정치",
  "keywords": ["청년 실업", "창업지원센터", "조례안", "도정질문"],
  "summary": "김민수 의원이 청년 실업률 문제를 지적하며 청년창업지원센터 설립 조례안 발의 의사를 밝히고 도지사에게 입장을 질의함",
  "confidence": 0.95
}

▼

구조화 추출Structured Extraction

엔티티, 이벤트, 주장(SPO), 관계를 추출합니다 — 가장 핵심적인 단계

엔티티 (Entities)

👤 김민수 의원 (PERSON)👤 도지사 (PERSON)🏛 경상남도의회 (ORG)📋 청년창업지원센터 설립 조례안 (BILL)📍 우리 도 (LOCATION)

주장 (Claims — SPO 구조)

주어	서술어	목적어	유형	신뢰도
김민수 의원	주장하다	청년 실업률 12.5%	사실	0.90
김민수 의원	발의하다	청년창업지원센터 설립 조례안	사실	1.00
김민수 의원	질의하다	도지사의 입장	의견요청	0.85

관계 (Relationships)

김민수 의원—[소속]→경상남도의회

김민수 의원—[제안]→청년창업지원센터 설립 조례안

김민수 의원—[질의]→도지사

▼

동일체 해소Entity Resolution

중복 엔티티를 병합하고 정규화된 이름으로 통일합니다

OUTPUT

{
  "mergeLog": [
    {
      "merged": ["도지사", "도지사님"],
      "into": "박완수 도지사",
      "reason": "동일 직책 참조, 컨텍스트상 경남도지사로 확인"
    }
  ],
  "resolvedEntities": [
    { "canonical": "김민수 의원",     "type": "PERSON",       "mentions": 3 },
    { "canonical": "박완수 도지사",   "type": "PERSON",       "mentions": 1 },
    { "canonical": "경상남도의회",     "type": "ORGANIZATION", "mentions": 1 },
    { "canonical": "청년창업지원센터 설립 조례안", "type": "BILL", "mentions": 1 }
  ]
}

💡 "도지사님" → "박완수 도지사"로 병합. 임베딩 유사도(코사인 ≥0.85) 기반 후보군 선별 후 LLM이 최종 판단

▼

품질 게이트Quality Gate

추출 결과의 품질을 5개 카테고리로 평가합니다

종합 품질 점수

자동 통과 (≥80)

완전성85

정확성90

일관성88

구체성82

근거품질85

✅ 점수 86점 → 자동 통과. 80점 미만이면 사람이 직접 검토(HITL 리뷰)합니다.

▼

그래프 구축Graph Construction

추출된 데이터를 노드와 엣지로 변환하여 지식 그래프를 생성합니다

엔티티이벤트주장관계

GRAPH DATA

{
  "nodes": [
    { "id": "e1", "label": "김민수 의원",     "type": "entity" },
    { "id": "e2", "label": "경상남도의회",     "type": "entity" },
    { "id": "e3", "label": "박완수 도지사",   "type": "entity" },
    { "id": "ev1","label": "조례안 발의",     "type": "event"  },
    { "id": "c1", "label": "청년실업률 12.5%","type": "claim"  }
  ],
  "edges": [
    { "source": "e1", "target": "e2", "label": "소속" },
    { "source": "e1", "target": "e3", "label": "질의" },
    { "source": "e1", "target": "ev1","label": "제안" },
    { "source": "e1", "target": "c1", "label": "주장" }
  ]
}

▼

추론 및 검색Inference & Search

Datalog 규칙으로 새로운 사실을 추론하고, 문서 간 연결을 발견합니다

OUTPUT

{
  "derivedFacts": [
    {
      "statement": "김민수 의원은 경상남도의회를 통해 박완수 도지사에게 간접적으로 연결됨",
      "basedOn": ["김민수→경남도의회(소속)", "경남도의회→도지사(감독)"],
      "confidence": 0.88
    }
  ],
  "insights": [
    {
      "insight": "청년 실업 관련 조례안이 발의됨 — 향후 관련 정책 변화 가능성",
      "category": "trend",
      "relevance": 0.82
    },
    {
      "insight": "도지사에 대한 직접 질의 — 행정부 대응 모니터링 필요",
      "category": "risk",
      "relevance": 0.75
    }
  ]
}

💡 단일 문서 안에서도 추론이 작동하지만, 여러 문서가 쌓이면 문서 간 숨겨진 관계를 자동으로 발견합니다

REAL-WORLD DEMO

실제 회의록으로 보는 변환 과정

경상남도의회 제428회 본회의 회의록(2025.11.27)에서 발췌한 실제 데이터입니다

📜 실제 회의록 발췌 — 경상남도의회 제428회

○김구연 의원 존경하는 330만 도민 여러분! 유계현 부의장님과 선배 동료 의원 여러분! 박완수 지사님과 박종훈 교육감님을 비롯한 공직자 여러분! 반갑습니다. 지리산, 섬진강, 남해 바다가 있는 삼포지향 하동군 출신 김구연 의원입니다. 지금 경남에는 두 가지 큰 전환이 동시에 진행되고 있습니다. 하나는 시장 경쟁 속에서 구조조정이 진행되고 있는 자동차 부품 산업의 전환이고, 또 다른 하나는 국가 에너지 정책에 따라 일정과 방식이 이미 결정된 석탄화력발전소의 단계적 폐쇄입니다. 제11차 전력수급 기본계획에 따르면 2026년부터 2031년까지 하동, 삼천포 지역의 석탄화력발전소 14기 중 10기가 순차적으로 폐쇄될 예정입니다.

추출된 엔티티

김구연 의원유계현 부의장박완수 지사박종훈 교육감경상남도의회하동군삼천포석탄화력발전소제11차 전력수급 기본계획자동차 부품 산업

추출된 관계

김구연—[소속]→경남도의회

김구연—[출신]→하동군

김구연—[질의]→경제통상국장

박완수 지사—[감독]→경상남도

핵심 주장 (Claims)

주어	서술어	목적어	유형	신뢰도
김구연 의원	주장	석탄화력발전소 14기 중 10기가 2026~2031년 순차 폐쇄 예정	사실	1.00
김구연 의원	지적	경남에 자동차 부품 산업 전환과 석탄화력 폐쇄가 동시 진행	사실	0.95
김구연 의원	요구	정의로운 전환 정책 수립 필요	의견	0.80

근거: “제11차 전력수급 기본계획에 따르면 2026년도부터 2031년까지 하동, 삼천포 지역의 석탄화력발전소가 순차적으로 폐쇄될 예정입니다”

🧠 추론 결과 (Inference)

trend석탄화력 폐쇄와 자동차 산업 구조조정이 동시에 경남 지역에 영향 — 복합 경제 위기 패턴 감지

risk2026년부터 시작되는 발전소 폐쇄 일정이 구체적 — 시간적 긴급성 높음

opportunity정의로운 전환 정책과 산업 전환 교육지원센터 논의 — 정책 대응 기회 존재

USE CASES

활용 사례

다양한 조직과 상황에서 Fact Explorer를 활용할 수 있습니다

🏛

지방의회 · 국회

회의록에서 의원별 발언·입장·질의를 자동 추출하여 의정활동 분석, 정책 추적, 상충되는 발언 감지

📰

언론사 · 팩트체크

기사·보도자료에서 주장을 SPO 구조로 분리하고 근거를 추적. 교차 문서 모순 자동 탐지

🏢

공공기관 · 감사

정책 보고서, 사업 계획서에서 핵심 엔티티와 관계를 추출하여 이해관계 네트워크 시각화

⚖️

법률 · 규제

법률문서, 판례에서 조문 간 참조 관계와 적용 사례를 지식 그래프로 구축

🔬

연구기관 · 싱크탱크

논문, 보고서에서 연구 주제 간 연결고리와 트렌드를 자동 추출하여 문헌 분석 가속화

🏗

기업 · 내부 지식관리

회의록, 이메일, 내부 문서에서 의사결정 이력과 담당자를 추적하는 조직 지식 베이스 구축

TECHNOLOGY

기술 스택

엔터프라이즈급 안정성과 확장성을 갖춘 기술 기반

프론트엔드

Next.js 16 · React 19 · TypeScript · Tailwind CSS v4 · Cytoscape · Three.js

AI / NLP

LLM 기반 7단계 파이프라인 · Qwen3 임베딩(4096차원) · 하이브리드 검색(BM25+kNN)

데이터 저장

PostgreSQL 16 + pgvector · Neo4j 5 (그래프) · OpenSearch 2.17 (검색) · Redis 7

추론 엔진

Soufflé Datalog · Apache Jena Fuseki (RDF/SPARQL) · OWL 온톨로지 · SHACL 검증

작업 처리

BullMQ 큐 · 자동 재시도 · DLQ(실패 큐 관리) · HITL 리뷰 게이트

품질 보증

PROV-O 출처 추적 · ISO 25059 모델 카드 · 5축 품질 게이트 · 사람 검증

데이터 흐름

텍스트 입력→AI 파이프라인→HITL 검증→PostgreSQL→Neo4j 그래프OpenSearch 검색Fuseki RDF

CORE TECHNOLOGIES

핵심 기술 깊이 이해하기

Fact Explorer를 가능하게 만드는 세 가지 핵심 기술을 사례와 함께 소개합니다

RAG vs GraphRAG

RAG(Retrieval-Augmented Generation)는 AI가 답변할 때 관련 문서를 먼저 검색하여 참고하는 기술입니다. 하지만 일반 RAG와 Fact Explorer의 GraphRAG는 근본적으로 다릅니다.

💬 같은 질문, 다른 답변

“김구연 의원이 제안한 법안과 관련된 다른 의원들의 입장은?”

일반 RAG

1. 검색

“김구연”, “법안” 키워드로 텍스트 청크를 검색

2. 결과

김구연 의원 발언이 포함된 문단 3~5개를 찾음

3. 답변

찾은 문단을 기반으로 답변 생성 — 다른 의원의 발언은 검색되지 않아 누락

⚠️ “관련된 다른 의원”을 찾으려면 이미 그 연결을 알아야 검색할 수 있음 — 순환 문제

GraphRAGFact Explorer

1. 벡터 검색

“김구연 의원”을 의미적으로 검색 → 엔티티 발견

2. 그래프 탐색

김구연 → [제안] → 석탄화력 폐지지역 지원 특별법 → [반대] → 박영호 의원
김구연 → [질의] → 경제통상국장 → [답변] → 관련 정책 설명

3. 추론 조회

Datalog 규칙으로 “같은 법안에 대해 상충되는 입장” 자동 발견

4. 답변

구조화된 관계 + 추론 결과를 기반으로 근거가 있는 포괄적 답변 생성

✅ 그래프를 따라가며 연결된 의원들을 자동 발견 — 미리 알 필요 없음

비교 항목	일반 RAG	GraphRAG (Fact Explorer)
검색 방식	텍스트 청크 유사도 검색	하이브리드 검색(BM25+벡터) + 그래프 N-hop 탐색
컨텍스트 단위	비정형 텍스트 조각	구조화된 엔티티, 주장, 관계
멀티홉 질의	불가 — A와 C의 관계를 알려면 A→B→C를 모두 포함하는 청크가 필요	그래프 탐색으로 최대 3홉까지 자동 확장
모순 탐지	불가	Datalog 규칙으로 주장 간 상충 자동 발견
교차 문서	하나의 뭉치로 취급	글로벌 엔티티 매칭 + 문서 간 관계 추적
투명성	블랙박스 — 어떤 문서를 참고했는지만 표시	도구 호출 이력 + 근거 엔티티/주장 추적 + 추론 증명 트리

GraphRAG가 사용하는 5가지 도구

Fact Explorer의 GraphRAG는 질문의 복잡도를 자동 판별한 뒤, 최대 7번의 반복 루프에서 아래 도구들을 조합합니다.

벡터 검색vector_search

BM25(키워드) + kNN(의미) 하이브리드 검색. RRF(Reciprocal Rank Fusion)로 두 결과를 합산하여 정확도와 의미 모두를 잡습니다.

그래프 탐색graph_query

Neo4j에서 1~3홉 그래프 확장. 시작 엔티티에서 관계를 따라가며 연결된 엔티티, 이벤트, 주장을 발견합니다.

추론 조회souffle_infer

Datalog 규칙으로 미리 추론된 사실을 조회합니다. 모순, 영향력 네트워크, 정책 연결 등 논리적 관계를 반환합니다.

문서 컨텍스트get_document_context

특정 문서의 요약, 분류, 전체 텍스트, 추출된 엔티티/주장 등 원본 컨텍스트를 제공합니다.

교차 문서 엔티티cross_doc_entities

여러 문서에 등장하는 동일 인물/기관을 글로벌 엔티티 DB에서 검색합니다. “박완수 도지사가 언급된 모든 회의록”을 찾을 수 있습니다.

Datalog 추론 엔진

Datalog는 “만약 A가 참이고 B가 참이면, C도 참이다”라는 논리 규칙으로 새로운 사실을 자동 추론하는 언어입니다. SQL이 “저장된 데이터를 조회”한다면, Datalog는 “저장된 데이터로부터 새 데이터를 만들어냅니다”. Fact Explorer는 Soufflé 엔진을 사용하여 추출된 지식 그래프에서 사람이 발견하기 어려운 관계를 자동으로 도출합니다.

📐 Datalog 기본 개념 — 3분 이해

1. 사실 (Fact) — 이미 알고 있는 것

소속(“김구연”, “경상남도의회”). 소속(“박완수”, “경상남도”). 감독(“경상남도의회”, “경상남도”).

= 추출 파이프라인이 찾아낸 관계들

2. 규칙 (Rule) — 새 사실을 만드는 공식

영향력(X, Y) :- 소속(X, A), 감독(A, B), 소속(Y, B).

= “X가 A에 소속, A가 B를 감독, Y가 B에 소속이면 → X는 Y에게 영향력이 있다”

3. 추론 결과 (Derived Fact) — 자동으로 도출된 것

영향력(“김구연”, “박완수”). ← 자동 도출!

= 김구연 의원은 경상남도의회를 통해 경상남도를 감독하므로, 도지사 박완수에게 영향력이 있다

Fact Explorer의 8가지 추론 규칙 — 실제 사례

각 규칙은 추출된 엔티티·관계·주장을 입력받아, 사람이 직접 읽어도 발견하기 어려운 새로운 사실을 만들어냅니다.

1동일 엔티티 (same_entity)별칭 매칭

규칙

두 엔티티가 같은 별칭(alias)을 공유하면 → 동일 엔티티

예시: 문서A에 “박완수 도지사”, 문서B에 “박완수 경남지사” → 별칭 “박완수”가 겹침 → 동일 인물로 연결, 두 문서의 정보를 통합할 수 있음

2연결 관계 (connected)최대 5홉

규칙

관계의 관계의 관계를... 최대 5단계까지 추적하여 간접 연결을 발견

예시: 김구연 → 소속 → 경남도의회 → 감독 → 경상남도 → 관할 → 하동군 → 김구연과 하동군이 3홉으로 연결. 직접적으로 “출신” 관계가 없어도 간접 연결을 발견합니다.

3모순 탐지 (contradiction)직접 + 전이적

규칙

두 주장이 직접 상충하거나, A가 B를 지지하고 B가 C와 상충하면 → A와 C도 상충

예시 (직접): 주장A “석탄화력 14기 중 10기 폐쇄 예정” vs 주장B “석탄화력 폐쇄 계획 없음” → 직접 모순

예시 (전이적): 주장A가 주장B를 지지, 주장B가 주장C와 모순 → 주장A도 주장C와 간접 모순. 100개 문서에서 이런 간접 모순을 사람이 찾는 건 거의 불가능하지만, Datalog는 즉시 발견합니다.

4파생 지지 (derived_support)지지 체인

규칙

A가 B를 지지하고 B가 C를 지지하면 → A는 C를 간접 지지

예시: “경남 청년실업률 12.5%”(통계) → 지지 → “청년 지원 정책 필요”(의견) → 지지 → “창업지원센터 설립 조례안”(법안)
→ 통계 데이터가 조례안의 간접적 근거가 됨을 자동으로 발견

5영향력 네트워크 (influences)소속·감독·제안

규칙

소속, 감독, 제안, 승인 등의 관계를 추적하여 간접 영향력 발견

예시: 김구연 의원 → 소속 → 경남도의회 → 감독 → 경상남도 ← 소속 ← 경제통상국장
→ 김구연 의원이 경제통상국장에 대한 간접 영향력 보유. 도정질문에서 경제통상국장에게 직접 질의하는 것이 이 영향력 구조에 기반함을 확인

6동일 주제 모순 (subject_contradiction)발언자 추적

규칙

같은 사람이 같은 주제에 대해 상충되는 사실 주장을 한 경우

예시: 김민수 의원이 3월 회의에서 “예산 10% 증액 필요”, 9월 회의에서 “예산 동결이 적절”
→ 동일 인물의 입장 변화를 자동 감지. 의정 활동 분석이나 팩트체크에 핵심적인 기능

7정책 연결 (policy_chain)제안→승인

규칙

누가 정책을 제안했고 누가 승인했는지의 체인을 추적

예시: 김구연 의원 → 제안 → 석탄화력 폐지지역 지원 특별법 ← 승인 ← 산업통상자원부
→ 정책 결정 과정의 제안자-승인자 관계 자동 추적. “이 법안은 누가 밀었고 누가 통과시켰는가?”에 대한 답

8대립 관계 (opposition)찬반 구도

규칙

한쪽이 제안/지지하고 다른 쪽이 반대/상충하면 → 대립

예시: 김구연 의원이 “정의로운 전환 예산 확대”를 제안, 박영호 의원이 같은 안건에 반대
→ 두 의원 간 대립 관계 자동 식별. 안건별 찬반 구도를 시각화하는 데 활용

내부 동작 원리

PostgreSQL 데이터→TSV로 변환→Soufflé 엔진→8가지 규칙 적용→추론 결과 저장

추출된 엔티티·관계·주장이 Soufflé에 입력되면, 규칙이 동시에 적용되어 모든 가능한 추론 결과를 한번에 도출합니다.
주장 간 상충 판별에는 임베딩 유사도(코사인 ≥0.85)와 한국어 부정 키워드 탐지가 활용됩니다.

ANALYSIS EXPERIENCE

추출 이후 — 분석, 탐색, 질문

추출된 지식을 대시보드, 그래프, 대화형 AI로 탐색하고 인사이트를 발견합니다

콘솔 대시보드

대시보드에서 전체 추출 현황을 한눈에 파악합니다. 문서, 엔티티, 주장, 관계, 추론 결과의 통계와 분포를 실시간으로 모니터링합니다.

fact-explorer.core.today/console

📄

문서

👤

892

엔티티

📅

156

이벤트

💬

1,247

주장

🔗

2,384

관계

🧠

312

추론

엔티티 유형 분포

PERSON

38%

ORG

22%

LOCATION

15%

POLICY

12%

BILL

기타

품질 게이트 분포

자동 통과 (≥80)72%

예외 검토 (40-79)23%

강제 승인 (<40)5%

인터랙티브 그래프 탐색

추출된 엔티티와 관계를 시각적으로 탐색합니다. 노드를 선택하면 연결된 관계가 하이라이트되고, 점선은 Datalog 추론으로 발견된 간접 관계를 나타냅니다.

인물조직장소시설법안 추출 추론

계층형 — 상하 트리 구조로 종속 관계를 명확히 표시

노드 선택

노드를 클릭하면 연결된 엣지가 하이라이트됩니다. 위 그래프에서 직접 클릭해 보세요.

레이아웃 전환

DAGRE(계층형), FCOSE(힘 기반), D3-Force(방사형) 버튼으로 배치를 전환해 보세요.

추론 엣지 토글

점선(추론 관계)을 켜고 끌 수 있어 원본 데이터만 집중 분석 가능합니다.

GraphRAG 대화형 질의

자연어로 질문하면 벡터 검색, 그래프 탐색, 추론 조회를 자동으로 조합하여 근거가 있는 구조화된 답변을 생성합니다.

fact-explorer.core.today/graphrag

이전 대화

석탄화력 관련 질의

박완수 지사 활동 분석

정의로운 전환 정책

검색 범위

전체현재 문서

김구연 의원이 석탄화력 관련해서 어떤 주장을 했나요?

벡터 검색 3건 142ms · 그래프 탐색 7건 89ms · 추론 조회 2건 34ms

김구연 의원은 석탄화력발전소 관련하여 다음과 같은 주장을 했습니다: 1. **단계적 폐쇄 사실 지적** — "제11차 전력수급 기본계획에 따르면 2026년부터 2031년까지 하동·삼천포 지역 석탄화력발전소 14기 중 10기가 순차 폐쇄 예정" [신뢰도 1.0, 도정질문 회의록] 2. **정의로운 전환 요구** — "석탄화력 폐쇄 지역에 대한 체계적 지원 정책 필요" [신뢰도 0.80, 의견] 3. **복합 위기 경고** — "자동차 부품 산업 구조조정과 석탄화력 폐쇄가 동시 진행되어 경남 경제에 이중 타격" [신뢰도 0.95] 📊 **관련 추론:** 박완수 지사에 대한 간접 영향력 경로(3홉)가 발견되었으며, 박영호 의원과 폐지지역 지원법에 대한 대립 관계가 감지되었습니다.

scope: 전체/문서/선택도구 자동 조합 (최대 7회 반복)근거 추적 (엔티티·주장 인라인 참조)

교차 문서 비교

서로 다른 문서에서 추출된 엔티티와 주장을 나란히 비교합니다. 공유 엔티티는 하이라이트되어 입장 변화, 관계 변동을 즉시 파악할 수 있습니다.

도정질문문서 A

도정질문 (2025.11.27)

⭐ 박완수 지사⭐ 하동군석탄화력발전소경남도의회

핵심 입장: 폐쇄 대비 지원 정책 촉구

예산심의문서 B

예산안 심의 (2025.12.15)

⭐ 박완수 지사⭐ 하동군정의로운전환기금경제통상국

핵심 입장: 전환 기금 예산 편성 논의

💡 동일 인물이 여러 회의에서 보인 입장 변화나, 문서 간 정책 연결고리를 자동으로 발견합니다

인사이트 대시보드

Datalog 추론 엔진이 발견한 모순, 영향력 네트워크, 정책 체인 등의 인사이트를 신뢰도 점수와 함께 표시합니다. 각 인사이트는 증명 트리(Proof Tree)로 논리적 추론 경로를 추적할 수 있습니다.

모순

2024년 '석탄화력 유지' vs 2025년 '단계적 폐쇄 동의'

신뢰도

영향력

김구연 → 경남도의회 → 경상남도 → 박완수 지사 3홉 경로

신뢰도

정책 체인

석탄화력 폐지지역 지원 특별법 제안→심의→서명 체인

신뢰도

💡 각 인사이트를 클릭하면 증명 트리가 펼쳐져 “어떤 사실과 규칙에서 이 결론이 도출되었는가”를 확인할 수 있습니다

TRUSTWORTHY AI

신뢰할 수 있는 AI

HITL 리뷰, ISO 준수, 감사 추적으로 AI 결과의 투명성과 책임성을 보장합니다

HITL 리뷰 시스템

모든 추출 결과는 사람이 검증합니다. 엔티티, 주장, 관계를 항목별로 승인하거나 거부하고, 인라인 편집으로 AI 결과를 직접 수정할 수 있습니다.

✓

Step 3: 구조화 추출 — HITL 리뷰 중

✓

김구연 의원PERSON

승인됨

✎

석탄화력발전소FACILITY

편집 중...

경남 산업전환교육센터ORGANIZATION

거부됨

2/3 항목 승인

리뷰 저장전체 승인

항목별 승인/거부

엔티티, 주장, 관계를 개별적으로 승인하거나 거부. 거부된 항목은 자동 제외

인라인 편집

엔티티 이름, 유형, 주장 내용을 직접 수정. AI 추출 결과를 사람이 정교화

품질 게이트 연동

Step 5 품질 점수 80점 미만 시 자동으로 HITL 리뷰로 전환. 40점 미만은 강제 승인 필요

7단계 플로우: 자동 vs HITL

1. 정규화자동

→

2. 분류자동

→

3. 추출HITL

→

4. 해소HITL

→

5. 품질HITL

→

6. 그래프자동

→

7. 추론자동

ISO/IEC TR 24028 준수 개요

AI 신뢰성 국제 표준 9가지 카테고리 전체에서 “적합” 판정을 받았습니다. 각 카테고리는 실제 구현된 코드와 아키텍처로 뒷받침됩니다.

투명성

Transparency

적합

모델 카드, 파이프라인 스키마, PROV-O 출처 추적 공개

설명가능성

Explainability

적합

추론 증명 트리, 5축 품질 평가 근거 제공

제어가능성

Controllability

적합

HITL 단계별 승인/거부/편집, 품질 게이트 자동 분기

개인정보보호

Privacy

적합

Clerk 인증, 보존 기간 정책, 삭제 요청 지원

안전성

Safety

적합

폴백 매트릭스, Zod 입력 검증, DLQ 장애 격리

보안

Security

적합

API Rate Limiting, 감사 로그, PgBouncer 접근 차단

공정성

Fairness

적합

편향 자동 탐지, Shannon/Simpson 다양성 지수 평가

책임성

Accountability

적합

PROV-O 출처 추적, LLM 메트릭 실시간 수집

견고성

Robustness

적합

Graceful Degradation, 재시도, 원자적 잠금

ISO/IEC TR 24028 준수 현황9/9 적합

감사 추적 & 거버넌스

모든 파이프라인 활동, HITL 리뷰 결정, 품질 게이트 결과가 감사 로그로 기록됩니다. 42단계 검수 가이드를 통해 체계적으로 AI 신뢰성을 검증합니다.

감사 로그 (최근)

Step 3 구조화 추출 완료

extraction.step.complete

14:23:01

'석탄화력' 엔티티 거부됨

hitl.entity.rejected

14:25:17

Step 3 전체 승인 처리

hitl.step.approved

14:26:42

Step 5 품질 86점 자동 통과

quality.gate.auto_pass

14:27:03

50+ 이벤트 유형, 모든 활동 기록

42단계 검수 가이드

5개 카테고리, 총 42개 검수 항목으로 AI 시스템의 신뢰성을 체계적으로 검증합니다.

개인정보보호6보안10공정성8투명성10견고성8

총 검수 항목42개

모델 카드

ISO/IEC 25059 기반 모델 카드로 AI 모델의 특성, 용도, 한계, 알려진 편향을 투명하게 공개합니다.

📋

AI 모델 카드 (ISO/IEC 25059)

모델의 특성, 한계, 편향을 투명하게 공개

모델명 / 용도

CoreDot LLM · 비정형 텍스트→구조화 데이터 추출

알려진 편향

다수 의견 과대 대표, 한국어 문화적 편향, 학습 시점 편향

품질 관리

5축 품질 게이트, HITL 리뷰, PROV-O 출처 추적

범위 외 사용

개인정보 프로파일링, 자동 의사결정, 감시 목적 사용 금지

FAQ

자주 묻는 질문

Fact Explorer에 대해 궁금한 점을 확인하세요

Q. ChatGPT 같은 범용 AI와 뭐가 다른가요?

범용 AI는 질문에 답을 생성하지만, Fact Explorer는 구조화된 데이터를 추출합니다. 단순한 텍스트 요약이 아니라 엔티티·주장·관계를 SPO(주어-서술어-목적어) 구조로 분리하고, 이를 지식 그래프에 저장하여 교차 검증, 추론, 시각화가 가능합니다.

Q. AI가 추출한 결과를 어떻게 신뢰할 수 있나요?

모든 추출 결과는 5축 품질 게이트(완전성·정확성·일관성·구체성·근거품질)를 통과해야 합니다. 80점 미만은 자동으로 사람 검토(HITL)로 넘어가며, 모든 단계에서 PROV-O 기반 출처 추적이 기록됩니다. 근거 없는 주장은 신뢰도 점수로 명확히 구분됩니다.

Q. 한국어 문서만 처리 가능한가요?

현재 한국어에 최적화되어 있으며, 특히 지방의회 회의록 형식에 특화된 파서를 갖추고 있습니다. 파이프라인 자체는 다국어를 지원하도록 설계되었으나, 현재 프롬프트와 엔티티 유형은 한국어 도메인에 맞추어져 있습니다.

Q. 기존 시스템에 데이터를 연동할 수 있나요?

SPARQL 엔드포인트와 REST API를 제공하므로, 기존 BI 도구나 데이터 분석 시스템에서 추출된 지식 그래프를 직접 쿼리할 수 있습니다. RDF/OWL 표준을 따르므로 시맨틱 웹 생태계와 호환됩니다.

Q. 처리할 수 있는 문서 분량에 제한이 있나요?

단일 문서는 청크 분할을 통해 길이 제한 없이 처리됩니다. 회의록의 경우 회기별 세션 단위로 자동 분할되어 각각 독립적으로 추출 파이프라인을 통과합니다. BullMQ 큐 기반으로 동시에 여러 문서를 병렬 처리할 수 있습니다.

Q. 어떤 종류의 문서를 처리할 수 있나요?

회의록, 보고서, 논문, 법률문서, 연설문, 뉴스 기사 등 텍스트 기반 문서를 처리합니다. 문서 유형은 자동 분류되며, 각 유형에 맞는 추출 전략이 적용됩니다. 특히 회의록은 화자 분리, 질의-답변 매칭 등 전용 파서가 지원됩니다.

Q. 추출이 끝나면 어떤 분석이 가능한가요?

콘솔 대시보드에서 문서·엔티티·주장·관계 현황을 한눈에 파악하고, 인터랙티브 그래프에서 노드와 관계를 직접 탐색할 수 있습니다. GraphRAG 채팅으로 자연어 질문을 하면 벡터 검색·그래프 탐색·추론 조회를 자동 조합하여 근거 기반 답변을 생성합니다. 교차 문서 비교로 동일 인물의 입장 변화나 문서 간 관계를 발견하고, 인사이트 대시보드에서 모순·영향력·정책 체인 등 Datalog 추론 결과를 확인할 수 있습니다.

Q. AI 신뢰성은 어떻게 보장하나요?

ISO/IEC TR 24028 기반 9가지 신뢰성 카테고리(투명성·설명가능성·제어가능성·개인정보보호·안전성·보안·공정성·책임성·견고성) 전체에서 '적합' 판정을 받았습니다. 모든 추출 단계에서 HITL(Human-in-the-Loop) 리뷰로 항목별 승인/거부/편집이 가능하고, PROV-O 기반 출처 추적으로 감사 추적이 완전합니다. 42단계 검수 가이드를 통해 개인정보보호·보안·공정성·투명성·견고성 5개 영역을 체계적으로 검증합니다.

비정형 텍스트에서구조화된 지식을 추출합니다

Fact Explorer가 추출하는 5가지 핵심 개념

7단계 AI 파이프라인 — 가상 예시로 이해하기

실제 회의록으로 보는 변환 과정

활용 사례

지방의회 · 국회

언론사 · 팩트체크

공공기관 · 감사

법률 · 규제

연구기관 · 싱크탱크

기업 · 내부 지식관리

기술 스택

프론트엔드

AI / NLP

데이터 저장

추론 엔진

작업 처리

품질 보증

핵심 기술 깊이 이해하기

RAG vs GraphRAG

GraphRAG가 사용하는 5가지 도구

Datalog 추론 엔진

Fact Explorer의 8가지 추론 규칙 — 실제 사례

내부 동작 원리

추출 이후 — 분석, 탐색, 질문

콘솔 대시보드

인터랙티브 그래프 탐색

GraphRAG 대화형 질의

교차 문서 비교

인사이트 대시보드

신뢰할 수 있는 AI

HITL 리뷰 시스템

ISO/IEC TR 24028 준수 개요

감사 추적 & 거버넌스

모델 카드

자주 묻는 질문

Q. ChatGPT 같은 범용 AI와 뭐가 다른가요?

Q. AI가 추출한 결과를 어떻게 신뢰할 수 있나요?

Q. 한국어 문서만 처리 가능한가요?

Q. 기존 시스템에 데이터를 연동할 수 있나요?

Q. 처리할 수 있는 문서 분량에 제한이 있나요?

Q. 어떤 종류의 문서를 처리할 수 있나요?

Q. 추출이 끝나면 어떤 분석이 가능한가요?

Q. AI 신뢰성은 어떻게 보장하나요?

비정형 텍스트에서
구조화된 지식을 추출합니다