Datalog 추론

숨겨진 패턴을
논리로 찾아냅니다

Datalog 추론 엔진은 추출된 사실에 8가지 논리 규칙을 적용하여 모순, 영향력, 정책 체인, 대립 관계 등 사람이 놓칠 수 있는 패턴을 자동으로 도출합니다.

WHAT IS INFERENCE

추론이란?

AI가 추출한 사실만으로는 부족합니다. 사실 사이의 논리적 관계를 찾아야 진짜 인사이트가 됩니다.

01

사람이 읽으면 보이는 것

"A 의원이 예산 증액을 주장했고, B 의원은 삭감을 주장했다" — 사람은 이 두 문장을 읽고 즉시 '갈등'을 인식합니다.

02

기계가 놓치는 것

AI 추출 엔진은 각 문장에서 엔티티와 주장을 정확히 추출하지만, 두 주장이 서로 모순된다는 '관계'는 자동으로 알 수 없습니다.

03

추론이 찾아내는 것

Datalog 추론 엔진은 추출된 사실들 사이의 논리적 규칙을 적용해 모순, 영향력, 정책 체인 같은 숨겨진 패턴을 자동으로 도출합니다.

Datalog는 선언적 논리 프로그래밍 언어입니다. "이런 조건이 성립하면 → 이런 결론을 내려라"는 규칙을 정의하면, 엔진이 모든 데이터에 규칙을 자동 적용하여 새로운 사실을 도출합니다. fact.core.today는 Soufflé 엔진(C++ 기반 고성능 Datalog)을 사용합니다.

PIPELINE

추출에서 인사이트까지

텍스트가 추론 가능한 사실이 되고, 규칙이 적용되어 인사이트로 바뀌는 과정입니다.

1

추출

텍스트에서 엔티티, 주장, 관계를 추출

2

변환

추출 결과를 Datalog가 이해하는 사실(Fact)로 변환

3

추론

8가지 규칙을 적용해 새로운 사실을 도출

4

검토

도출된 인사이트를 사람이 확인·반박·무시

입력 데이터: 6가지 사실 테이블

추출 결과가 Datalog 엔진에 전달되는 형태입니다

entity추출된 모든 엔티티 (인물, 기관, 법안 등)
alias엔티티의 별칭 (동일 인물의 다른 표현)
relationship엔티티 간 관계 (소속, 제안, 승인, 반대 등)
claim문서에서 추출된 주장
claim_supports주장 간 지지 관계
claim_contradicts주장 간 모순 관계
RULES

8가지 추론 규칙

각 규칙을 클릭하면 상세 설명, 예시 시나리오, 실제 Datalog 코드를 확인할 수 있습니다.

모순 감지
영향력 추적
연결 발견
엔티티 통합
EXAMPLE

실제 예시: 예산 논쟁 분석

하나의 회의록에서 추론 엔진이 어떤 인사이트를 도출하는지 따라가 봅니다.

1

추출된 데이터

엔티티 5건

김OO 의원, 이OO 의원, 예산위원회, 교육부, 교육예산안

관계 4건

김OO→예산위(소속), 예산위→교육예산안(제안), 국회→교육예산안(승인), 이OO→교육예산안(반대)

주장 3건

"예산 5% 증액"(김OO), "지출 삭감 필요"(이OO), "교육부 예산 충분"(이OO)

2

Datalog 추론 실행 (~8초)

모순 규칙: "예산 5% 증액" ↔ "지출 삭감 필요" → 직접 모순 감지
영향력 규칙: 김OO → 예산위 → 교육예산안 → 간접 영향력 도출
정책 체인: 예산위(제안) → 국회(승인) → 제안→승인 워크플로
대립 규칙: 예산위(제안) ↔ 이OO(반대) → 대립 관계 감지
3

도출된 인사이트 4건

모순"예산 5% 증액" ↔ "지출 삭감 필요" — 직접 모순
영향력김OO → 예산위 → 교육예산안 — 2-hop 영향력
정책체인예산위(제안) → 국회(승인) — 교육예산안
대립예산위 ↔ 이OO 의원 — 교육예산안을 둘러싼 대립
REVIEW

인사이트 검토

도출된 인사이트는 자동 적용되지 않습니다. 사람이 확인, 반박, 무시 중 하나를 선택합니다.

확인

Confirm

도출된 사실이 맞다고 판단. 이후 GraphRAG 질의에서 신뢰할 수 있는 근거로 활용됩니다.

반박

Refute

도출된 사실이 틀리다고 판단. 반박 사유를 입력하면 이후 질의에서 자동 제외됩니다.

무시

Dismiss

판단을 보류합니다. 무시된 인사이트는 목록에서 흐리게 표시되지만 삭제되지 않습니다.

GraphRAG 연계

확인된 인사이트는 GraphRAG의 souffle_infer 도구를 통해 질의 응답에 활용됩니다. "모순이 있나?", "영향력 체인은?" 같은 질문에 Datalog 추론 결과를 근거로 제시합니다. 반박된 인사이트는 자동으로 제외됩니다.

BEST PRACTICES

활용 팁

Datalog 추론 결과를 효과적으로 활용하는 방법입니다.

🔴

모순부터 확인하기

모순(contradiction)과 주체별 모순(subject_contradiction)은 데이터 품질 문제를 가장 직접적으로 드러냅니다. 우선 검토하세요.

🔗

영향력 체인 추적

influences 규칙이 도출한 간접 영향력은 의사결정 구조를 파악하는 데 핵심입니다. 정책 분석에 활용하세요.

📝

반박은 근거와 함께

인사이트를 반박할 때 사유를 꼼꼼히 적으면, 이후 같은 패턴의 오류를 식별하는 데 도움이 됩니다.

🔄

재실행 활용

HITL 검토로 엔티티나 관계를 수정한 뒤 "재실행" 버튼을 누르면 새로운 데이터로 추론을 다시 수행합니다.

💬

GraphRAG와 연계

"모순이 있나?", "영향력 체인은?" 같은 질문을 GraphRAG에 하면 Datalog 추론 결과를 활용한 답변을 받을 수 있습니다.

📊

연결 hop 수 해석

connected 규칙의 hop 수가 작을수록 강한 연결입니다. 1-2 hop은 직접적 관계, 4-5 hop은 약한 간접 연결로 해석하세요.

사실 탐색의 새로운 기준

텍스트에서 검증 가능한 사실 구조를 만들고, 그 위에서 탐색·추론·검토를 시작하세요.