Evidence-first Fact Exploration Platform

텍스트에서
검증 가능한 사실 그래프
만듭니다

문서에서 엔티티·이벤트·클레임·근거를 구조화하고,탐색·추론·검토가 하나로 연결된 사실 탐색 플랫폼

SCROLL
WHY FACT EXPLORER

기존 검색의 한계

단순 키워드 검색과 LLM 단독 답변이 해결하지 못하는 네 가지 핵심 문제

01

문서 중심 검색의 한계

키워드 기반 검색은 관련 문서를 찾을 수는 있지만, 사건 단위·주장 단위로 재구성하지 못합니다.

02

사실과 의견의 혼합

동일한 문장이라도 사실, 추정, 평가를 구분해야 하지만 기존 시스템은 이를 분리하지 못합니다.

03

설명 가능성 부족

LLM 단독 답변은 빠르지만, 어떤 문장과 어떤 구조를 근거로 결론이 나왔는지 추적하기 어렵습니다.

04

운영 리스크

민감한 주제, 동명이인, 의혹성 주장을 자동 게시하면 신뢰와 안전이 흔들립니다.

PIPELINE

텍스트가 지식으로 변환되는 과정

비정형 문서가 구조화된 사실 그래프로 변환되는 9단계 여정

원문_기사_2024.txt

2024년 3월 15일, 삼성전자는 차세대 반도체 기술인 GAA 트랜지스터 기반의 2나노 공정 양산 시작을 발표했다. 이재용 회장은 기자회견에서 "기술 리더십을 강화하겠다"고 밝혔다. TSMC와의 경쟁에서 우위를 점하기 위한 전략으로, 50조 원 규모의 투자 계획을 발표했다.

Knowledge Graph
삼성전자이재용GAATSMC양산 발표50조 투자기술 리더십
파이프라인 시작 대기 중...
EEntity
VEvent
CClaim
PRINCIPLES

서비스 핵심 원칙

Fact Explorer의 모든 설계 결정을 관통하는 6가지 원칙

01
01

Evidence-first

모든 엔티티, 이벤트, 클레임, 파생 사실은 원문 근거와 출처를 남긴다. 근거 없는 노드는 존재하지 않는다.

02
02

Event + Claim 중심

엔티티-엔티티 간 임의 관계보다, 사건과 주장의 구조를 우선 모델링한다. 12개 상위 Event 타입으로 제한.

03
03

Canonical Graph 우선

표면형(surface form)과 canonical entity를 분리하고, 확정된 동일체만 운영 그래프에 반영한다.

04
04

검색과 추론 분리

검색은 OpenSearch + GraphRAG, 탐색형 파생 사실은 Soufflé, 형식 검증은 SHACL/온톨로지 레인에서 수행.

05
05

Human-in-the-Loop

민감 항목, 병합 불확실 후보, 새 subtype, 고노출 결과는 사람이 승인한다.

06
06

Projection 기반 운영

PostgreSQL을 정본으로 두고 Neo4j, RDF Store, OpenSearch는 투영(projection)으로 운영. 스키마 변경 시 재투영.

CORE DATA MODEL

5가지 핵심 단위

Fact Explorer의 모든 정보는 다섯 가지 기본 단위로 구조화됩니다

Document

원문 텍스트와 메타데이터를 보관하는 기본 단위

raw_textpublisherdocument_typedomain_tags
Entity

인물, 기관, 장소, 법안, 예산, 정책, 위원회 등 9종 개체

mentioncanonical_idtypealiases
Event

무엇이 일어났는가를 표현하는 사건 단위

upper_typehasAgenthasIssueoccursOn
Claim

문서나 발언이 표현하는 주장 단위

claim_typemodalitycertaintyattributed_to
Insight

추론 엔진이 도출한 모순, 영향력, 정책 체인 등 파생 사실

rule_typeconfidenceproof_treeaction
Document→ 추출 →Entity+Event+Claim→ 추론 →Insight
LIVE DEMO

사실 그래프가 만들어지는 과정

원문 텍스트에서 구조화된 사실 그래프로 변환되는 과정을 확인하세요

source_text.txt

김민수 의원2025년 3월 서울시의회 본회의에서 친환경차 예산 확대를 요구했다. 같은 회의에서 박영희 의원은 재정 부담을 이유로 예산 확대에 반대했다. 서울시는 이후 4월에 시범 보급 확대 계획을 발표했다.

entity
time
issue
person
organization
location
date
product
issue
event
claim
document
FACT GRAPHinteractive
스크롤하여 그래프를 확인하세요
16 nodes · 21 edges
MINI EXPLORER

사실 그래프 탐색

검색하고, 클릭하고, 더블클릭하여 사실 그래프를 탐색하세요. 여러 문서에 걸친 동일 인물/기관도 자동으로 통합됩니다.

시작하기

검색하여 노드를 추가하거나
노드를 클릭하여 상세 정보를 확인하세요

위 검색바에서 인물, 기관, 이슈를 검색하세요

0 nodes · 0 edges더블클릭으로 이웃 노드 확장 · 드래그로 이동
KEY FEATURES

Fact Explorer가 제공하는 가치

사건 단위 빠른 탐색

문서 더미가 아니라 사건 단위와 주장 단위로 결과를 볼 수 있습니다. 이슈 타임라인, 인물 프로필, 주장-반박 체인을 한 눈에.

📎

근거 확인

모든 노드와 엣지에 원문 근거 span과 출처 문서가 연결됩니다.

🕸️

관계 이해

찬반, 반박, 후속 조치, 결과 흐름을 그래프로 탐색합니다.

🛡️

신뢰 가능한 운영

ISO/IEC TR 24028 기반 9개 카테고리 전 항목 적합. HITL 승인, 공정성 메트릭, 편향 탐지, 보안 감사 로그, 데이터 보존 정책까지 갖춘 신뢰할 수 있는 AI 시스템입니다.

🏛️

지식 자산화

일회성 분석이 아니라, 시간이 갈수록 누적되는 사실 그래프를 운영 자산으로 축적합니다.

🔗

크로스 문서 분석

여러 문서에 걸쳐 동일 인물·기관을 자동으로 연결합니다. 문서 간 모순 탐지와 영향력 추적이 가능합니다.

인사이트 조치

추론 결과를 확인·반박·무시로 분류하여 검증된 인사이트만 활용할 수 있습니다.

System Architecture

전체 아키텍처 구성도

PostgreSQL 정본 중심 — 추출 · 검증 · 추론 · 검색의 Projection 기반 운영

INGESTION LAYEREXTRACTION LAYERCANONICAL STOREQUALITY GATEPROJECTION LAYERSERVICE LAYER문서 수집 / 업로드Ingestion Gateway문서 분류Document Classifier · 9 types청킹 / 정규화TextUnits + Metadata워크플로우Orchestrator · Temporal엔티티 추출기Entity Extractorperson · org · issue · place+ evidence span + confidence이벤트 추출기Event Extractor12 upper types · subtypehasAgent · hasTopic · occursOn클레임 추출기Claim Extractor5 claim types · 6 modalitiessupports · contradicts · follows동일체 해소Entity Resolutionalias · eqrel · embedding4-state model · HITL reviewPROV-OProvenance 기록PostgreSQL — 정본 DBDocument · Entity · Event · Claim · Review · DerivedFactObject Storage원문 · 청크 · 모델 산출물품질 게이트SHACL · HITL · auto / review / forcedNeo4j운영 그래프 · 탐색 · 타임라인RDF StoreOWL 2 · SHACL · 검증 레인OpenSearchRRF Hybrid · Qwen3-Embed-8BSouffléDatalog · eqrel · 추론RedisFact Explorer UIReview ConsoleGraphRAG QAREST / GraphQL APIAdmin DashboardLEGEND추출 흐름투영 (Projection)검증 / HITL보조 연결수집추출정본검증해소추론

사실 탐색의 새로운 기준

텍스트에서 검증 가능한 사실 구조를 만들고, 그 위에서 탐색·추론·검토를 시작하세요.