인증 확인 중…

GG DataHub

데이터 통합 허브

27종 공공데이터·23 자산을 한 화면에 — 수집 상태·행 수·품질·정규화 산출물·원문 URL.

불러오는 중

데이터셋

27개

행 수집

22개

스냅샷

2개

정규화

23개

원천 행

3,262,662

도메인

4개

활용축

7개

확장후보

60개

발견카탈로그

4,702개

5-A 데이터허브 아키텍처

27종 raw → 23 정규화·AI·캐시 자산 → 6 데이터셋 결합 응답

사업계획서 5-A 슬라이드 동일 다이어그램 (mermaid 렌더, 1200×993)

GG Copilot 데이터허브 3-계층 아키텍처

2 트랙 구성 (v1.0 / 18p baseline)

시드 트랙

11

data/seed/public_datasets.csv → DB 적재

collected 8 · snapshot 2 · schema 1 — MVP 시연·기본 정규화의 1차 입력

확장 트랙

16

scripts/integrations/registry.py → 6 클라이언트

GGDreamOpenAPI 5 · DataGoOpenAPI 2 · DataGoFile 6 · VWorld 1 · covered_by_other 2 — 데이터허브 종횡 결합용

23종 자산 분해: 지표/공간 12종 + AI 정제 6종 + 사전 통계 캐시 5

27종 통합 인벤토리

데이터셋 27종 — 3,262,662

시드 11종 (DB 적재) + 확장 16종 (registry.py · 6 클라이언트). client·platform·검색·트랙으로 필터링 가능.

시군구 색상 — 빨강(≥25, 전국 커버) · 주황(≥15, 광역) · 노랑(≥5, 권역) · 회색(<5 또는 단일) · 카드 클릭 → 상세

데이터허브 시연 산출물 라이브러리

사전 산출 9 JSON — 페르소나 4건 · 시군구×업종 5

deterministic SHA-256 derivation으로 동일 입력 → 동일 산출 재현. 발표평가에서 같은 명령 재실행 시 trace_id 일치.

📋 케이스 ② 공고 매칭 — 4 페르소나

수원 · 35세 · 예비창업

수원 푸드테크 예비창업자

건국대학교 2026 식품외식·푸드테크 기술사업화 교육 지원자 모집

pool 30,093 · top trace: trace_e0257ebbb8964f...

성남 · 32세 · 초기

성남 AI앱 초기창업자

성남 엔젤클럽 투자로드쇼(IR)

pool 30,093 · top trace: trace_a1b2c3d4_seong...

고양 · 45세 · 성장

고양 베이커리 소상공인

지역 특화제품 판로지원 사업

pool 30,093 · top trace: trace_g1h2i3j4_goyan...

안양 · 50세 · 재창업

안양 제조업 재창업자

안양시 해외전시회 개별 참가기업 지원사업

pool 30,093 · top trace: trace_k1l2m3n4_anyan...

🗺️ 케이스 ① 시군구×업종 결합 — 5 종합 프로파일

수원시 × 음식

⬇️

결합 6개 데이터셋

유동·매출·점포·운영·보증·시설

유동 96,357,390

점포 52

시설 9

hubq_69678dbce3797743

성남시 × IT

⬇️

결합 6개 데이터셋

유동·매출·점포·운영·보증·시설

시설 5

hubq_seongnam_it

고양시 × 베이커리

⬇️

결합 6개 데이터셋

유동·매출·점포·운영·보증·시설

시설 3

hubq_goyang_bakery

안양시 × 제조

⬇️

결합 6개 데이터셋

유동·매출·점포·운영·보증·시설

유동 45,923,787

시설 5

hubq_anyang_manuf

부천시 × 카페

⬇️

결합 6개 데이터셋

유동·매출·점포·운영·보증·시설

유동 61,927,361

점포 321

시설 2

hubq_bucheon_cafe

재생 명령: make demo-library · 산출 위치: data/profiles/demo/*.json

Snapshot Relation Finder

스냅샷 관계 탐색

2개 앵커 · 6개 관계

행 수집이 어려운 대시보드형 스냅샷을 앵커로 삼아, 이미 수집된 유동인구·카드소비·창업공간·지역분석 자산과의 연결 경로를 빠르게 찾습니다.

방문·매출 연결

경기도 실시간 방문소비 현황지도

93

카드 소비 데이터

방문소비 현황지도의 소비 활성도 신호를 카드매출 행 데이터로 확인합니다.

키: sigungu_name, base_date, time_slot

신호: 방문 · 소비 · 혼잡도 · 카드매출

산출물: market_card_sales.csv, market_summary.csv

다음 행동: 방문 밀집 지역의 소비 활성도를 카드매출 합계와 함께 근거 응답에 연결합니다.

시장성 보강

경기도 생활이동소비 분석 상황판

92

유동인구_시군구 단위 집계

생활이동 대시보드의 이동·체류 흐름을 행 수집된 유동인구 장형 지표로 검증합니다.

키: sigungu_name, base_month

신호: 생활이동 · 유동인구 · 월별 흐름 · 시군구

산출물: market_population_indicators.csv, market_summary.csv

다음 행동: 대시보드에서 확인한 이동 흐름을 시군구별 유동인구 평균·합계와 함께 인용합니다.

소비 근거 연결

경기도 생활이동소비 분석 상황판

88

카드 소비 데이터

생활이동·소비 집중 지역을 카드매출 금액과 소비 레코드로 보강합니다.

키: sigungu_name, base_date, time_slot

신호: 소비 · 지역 · 시간대 · 상권

산출물: market_card_sales.csv, market_summary.csv

다음 행동: 입지 또는 상권 판단 시 카드매출 합계와 생활이동 소비 흐름을 함께 제시합니다.

방문 수요 연결

경기도 실시간 방문소비 현황지도

86

유동인구_시군구 단위 집계

실시간 방문 밀집 신호를 시군구 단위 유동인구 지표와 연결합니다.

키: sigungu_name, base_date

신호: 방문 · 유동인구 · 인구 밀집 · 시군구

산출물: market_population_indicators.csv, market_summary.csv

다음 행동: 상권 혼잡도 설명에는 유동인구 평균과 방문소비 스냅샷을 함께 씁니다.

지역 참조 확장

경기도 생활이동소비 분석 상황판

78

경기도 지역 분석 데이터

대시보드형 지표를 지역분석 참조 카탈로그와 연결해 후속 분석 후보를 빠르게 찾습니다.

키: sigungu_name, analysis_theme

신호: 생활권 · 지역분석 · 시장성 · 입지

산출물: regional_analysis_references.csv

다음 행동: 추가 분석이 필요한 시군구는 경기 데이터분석포털 참조 데이터셋으로 확장합니다.

입지 후보 연결

경기도 실시간 방문소비 현황지도

74

경기도 창업보육센터현황

방문·소비 밀집 지역과 창업보육센터 공급을 같은 시군구 기준으로 비교합니다.

키: sigungu_name

신호: 방문 밀집 · 입지 · 창업공간 · 시군구

산출물: normalized_places.csv, market_summary.csv

다음 행동: 공간 후보 검토 시 주변 방문소비 신호와 보육실 공급량을 함께 확인합니다.

/datasets/search

데이터 탐색

공공데이터 원천 검색

/datasets/relationships

스냅샷 관계 탐색

스냅샷 데이터의 관련 수집 자산 검색

/datasets/expansion-candidates

확장 후보 큐

공식 포털 기반 후속 수집 후보 관리

/places/search

공간 허브

창업공간 검색

/market/summary

시장성 허브

지역별 시장 지표 연결

/evidence/envelope

근거 허브

Evidence Envelope 생성

Discovery Catalog

공식 포털 대량 발견 카탈로그

4,702개 발견 · P1 977

경기데이터드림 전체 목록, 경기 데이터분석포털 활용가능 데이터, 공공데이터포털 주요 키워드 결과를 별도 카탈로그로 수집해 탐색 풀을 넓혔습니다.

경기데이터드림 · 경기도

G-money 지원 현황

P1

경기도중소기업육성자금 운용 정보

관계축: 정책·금융지원

접근유형: Sheet/OpenAPI

발견 기준: all · 2026-05-15

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=AUK207PXX0L2WPUGOW3E31424162&infSeq=1&rows=100

경기데이터분석포털 · KT

성연령별 시군구단위 유출인구

P1

성연령별 시군구단위 유출인구

관계축: 지역·유동인구

접근유형: 이미지

발견 기준: all · 2026-05-15

URL: https://insight.gg.go.kr/dataSetList.do

공공데이터포털 · 공공데이터포털

소상공인시장진흥공단_상가(상권)정보

P1

전국 상가업소 데이터

관계축: 상권·소비

접근유형: fileData

발견 기준: 상권 · 2026-05-15

URL: https://www.data.go.kr/data/15083033/fileData.do

Expansion Queue

공식 포털 기반 확장 후보

60개 후보 · 수집행 530,038

경기데이터드림, 경기 데이터분석포털, 공공데이터포털에서 확인한 후속 수집 후보를 현재 수집 완료 데이터와 분리해 관리하고, 후보별 수집 결과를 별도 프로파일로 추적합니다.

즉시통합

15개

매핑설계

22개

원천접근

16개

품질보강

7개

서비스 고도화 우선순위

상권·소비 · 95

경기도 발달골목상권 추정매출 현황

즉시 통합 후보 · A · 76,299

정규화 매핑과 서비스 지표 산식에 연결

지역·수요 · 95

유동인구_시군구_시간대별_집계

즉시 통합 후보 · A · 41,910

정규화 매핑과 서비스 지표 산식에 연결

기업·성과 · 95

경기신용보증재단_중소기업업종별매출액

즉시 통합 후보 · A · 16,417

정규화 매핑과 서비스 지표 산식에 연결

경기데이터드림 · 경기도

경기도_가맹사업_매출정보

후보행수집

프랜차이즈 업종별 매출 흐름을 카드소비와 연결해 상권 매출 근거를 보강

상권·소비즉시 통합 후보 · 83점

수집결과: 행 수집 · 품질 A · 54행

관계축: 상권·소비

수집방식: Sheet/OpenAPI 후보

키: sigungu_name, industry_category, period

스키마 신호: 기준연도, 매출금액

다음 액션: 정규화 매핑과 서비스 지표 산식에 연결

품질 이슈: 원문 URL 컬럼이 없어 출처 추적은 데이터셋 URL 기준으로 보완한다.

근거: 경기데이터드림 데이터셋 검색

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=GGICH0T4YRUWIUYBSNLU38553469&infSeq=1&rows=100

경기데이터드림 · 경기신용보증재단

경기신용보증재단_소상공인 매출 및 사업자정보

후보행수집

소상공인 매출과 사업자 분포를 카드소비·상권지표와 연결해 시장성 판단을 보강

상권·소비품질 보강 필요 · 50점

수집결과: 행 수집 · 품질 B · 622행

관계축: 상권·소상공인

수집방식: Sheet/File 후보

키: sigungu_name, industry_category, sales_amount

스키마 신호: 사업자등록번호, 시군구명, 신청연월, 사업소득과세금액

다음 액션: 결측, 중복, 빈 컬럼을 정리한 뒤 적재 범위 재평가

품질 이슈: 평균 채움률 77.1%로 결측 보정 규칙이 필요하다. / 중복 행 4건이 있어 키 기준 중복 제거가 필요하다.

근거: 경기데이터드림 데이터셋 검색

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=6K6O0X1Y26FJ9KO4Q5XU37195917&infSeq=1&rows=100

경기데이터분석포털 · KT

목적인구_시군구 단위 집계

목록메타수집

방문 목적 기반 인구 흐름을 상권·업종 수요 판단에 활용

지역·수요매핑 설계 필요 · 81점

수집결과: 행 수집 · 품질 A · 100행

관계축: 지역·수요

수집방식: 분석포털 목록 상세 전환 후보

키: dsetId, sigungu_name, purpose, period

스키마 신호: dsetId, dsetNm, dsetClassCdNm, dsetTypeNm

다음 액션: 조인 키, 단위, 기간 기준을 확정한 뒤 부분 적재

품질 이슈: 채움률 80% 미만 컬럼 1개가 있어 선택 적재가 필요하다.

근거: 경기 데이터분석포털 활용가능 데이터

URL: https://insight.gg.go.kr/dataSetList.do

공공데이터포털 · 중소벤처기업부

중소벤처기업부_중소기업 지원사업 공고 조회 서비스

후보스냅샷수집

중앙·지자체·유관기관 지원사업 공고를 Action Hub 전국 확장 데이터로 활용

정책·금융원천 접근 필요 · 15점

수집결과: 스냅샷 · 품질 Snapshot

관계축: 정책·프로그램

수집방식: 공공데이터포털 OpenAPI 활용신청 후보

키: program_title, agency, target, deadline

스키마 신호: source_dataset_title, source_platform, source_url, access_mode

다음 액션: 활용신청, 인증키, 파일 다운로드 경로를 확보한 뒤 행 수집으로 전환

품질 이슈: 행 데이터가 아닌 HTML/포털 스냅샷으로 수집되어 활용 신청 또는 별도 파서가 필요하다.

근거: 공공데이터포털 데이터목록 검색

URL: https://www.data.go.kr/data/15157820/openapi.do

Hub Domains

데이터 도메인

원천 데이터의 재사용 단위

정책·프로그램 데이터

지원정책, 창업정보, 산업지원, 기업지원 공고를 공통 프로그램 자산으로 통합합니다.

분류: 지원정책, 창업정보, 산업지원, 지원사업

산출물: normalized_programs.csv

출력: 프로그램 카탈로그 · 공고 요건 활용 사례 · 실행 리포트 입력값

공간·입지 데이터

창업보육센터 위치와 규모를 지역 단위 공간 자산으로 관리합니다.

분류: 창업공간

산출물: normalized_places.csv, market_summary.csv

출력: 창업공간 후보 · 시군구 공간 공급 지표

상권·소비 데이터

유동인구와 카드소비를 지역·시간·업종 단위 시장성 근거로 연결합니다.

분류: 상권분석, 소비분석, 생활이동, 방문소비

산출물: market_population_indicators.csv, market_card_sales.csv, market_summary.csv

출력: 시장성 요약 · 입지 수요 근거 · Evidence Envelope 입력값

지역·확장 참조 데이터

지역분석 카탈로그와 외부 OpenAPI 스키마를 후속 확장 대기열로 관리합니다.

분류: 지역분석, 시장분석

산출물: regional_analysis_references.csv, schemas.json, source_metadata_snapshots.csv

출력: 확장 후보 · 품질 점검 대상 · 출처 추적 근거

Hub Use Cases

데이터허브 활용 축

공고 연결은 Action Hub 사례

implemented

원천 데이터 탐색

플랫폼, 카테고리, 수집 상태, 품질 기준으로 공공데이터 원천을 비교합니다.

자산: public_datasets, source_metadata_snapshots.csv

API: /datasets/search · /datasets/hub-summary

implemented

창업공간·입지 허브

창업보육센터와 시장요약을 시군구 기준으로 연결해 입지 후보를 탐색합니다.

자산: normalized_places.csv, market_summary.csv

API: /places/search · /market/summary

implemented

상권·소비 시장성 허브

유동인구와 카드소비 지표를 시장성 판단의 공통 근거로 제공합니다.

자산: market_population_indicators.csv, market_card_sales.csv

API: /market/summary · /evidence/envelope

use_case

공고 요건 활용 사례

기업 프로필과 공고 요건을 비교하는 Action Hub 응용 계층입니다.

자산: normalized_programs.csv, support_programs

API: /matches · /reports/generate

Relationship Map

데이터 관계 맵

public_datasetsnormalized_assets

원천 데이터셋을 공통 스키마 산출물로 정규화

산출: 검색, 품질 표시, 정합성 점검

normalized_places.csvmarket_summary.csv

시군구 기준 창업공간과 시장성 요약 연결

산출: 입지 후보와 지역별 공간 공급 판단

market indicatorsEvidence Envelope

상권 수요와 소비 지표를 근거 응답에 연결

산출: 시장성 리스크와 다음 행동

normalized_programs.csv + support_programsAction Hub

공고 요건을 기업 프로필과 비교

산출: 공고 요건 연결 사례와 실행 리포트

Quality Gates

허브 품질 게이트

수집 상태 분리

행 수집, 스키마 수집, 스냅샷 수집을 구분합니다.

증거: collection_status

정규화 산출물 추적

각 원천 데이터셋은 연결된 산출물 또는 확장 대기열을 가집니다.

증거: normalized_asset

출처·기준일 표준화

원문 URL, 기준일, 주의사항, 다음 행동을 함께 제공합니다.

증거: Evidence Envelope

Source Catalog

원천 데이터 카탈로그

정합성 보기

경기데이터드림 · 경기도

경기도 내 일자리 관련 지원정책 정보

대기

허브 역할: 지원정책 탐색, 사용자 필요지원 분류, 기업지원 정책 후보 추출

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=C3R46QAIB3ZHGXG2TDOQ29456117&infSeq=1&rows=100

경기데이터드림 · 경기도일자리재단

경기도일자리재단_잡아바 창업정보

대기

허브 역할: 예비창업자·초기창업자 대상 창업 프로그램, 교육, 지원정보 관계화

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=VYDQG5FLFI2ZPC5LINSW29482637&infSeq=1&rows=100

경기데이터드림 · 경기도

경기도 창업보육센터현황

대기

허브 역할: 지역별 창업공간·보육기관 탐색, 입지·공간지원 판단

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=U6410C24Y846I1B808302067781&infSeq=3

경기데이터드림 · 경기도

주요 핵심 산업지원 현황

대기

허브 역할: 업종별 R&D·사업화·산학연 협력·인프라 지원 후보 탐색

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=X5J0I42PD3LYA3DS9IF919361135&infSeq=1

경기데이터드림 · 민간데이터 통신

유동인구_시군구 단위 집계

대기

허브 역할: 시군별 유동인구, 상권 수요, 입지 매력도 분석

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=6SQDOFXWTXA9V98HRO8E34907014&infSeq=1

경기데이터드림 · 민간데이터 카드

카드 소비 데이터

대기

허브 역할: 지역·업종별 소비 규모, 시장성, 매출 가능성 보강

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=7Y02TF04H1WUB55Q4IZL35052374&infSeq=1

경기데이터드림 · 경기도

경기도 생활이동소비 분석 상황판

대기

허브 역할: 월별 생활이동, 이동수단, 소비 집중 지역 분석

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/lifeMove.do

경기데이터드림 · 경기도

경기도 실시간 방문소비 현황지도

대기

허브 역할: 실시간 인구 밀집도, 소비 활성도, 상권 혼잡도 분석

행: -컬럼: -정규화: -

URL: https://data.gg.go.kr/portal/crowedMgt.do

경기데이터분석포털 · 경기도

경기도 지역 분석 데이터

대기

허브 역할: 지역별 시장성·입지·수요 분석 리포트 생성

행: -컬럼: -정규화: -

URL: https://insight.gg.go.kr/dataSetList.do

공공데이터포털 · 소상공인시장진흥공단

소상공인시장진흥공단_상가(상권)정보_API

대기

허브 역할: 전국 확장, 경기 지역 필터링, 경쟁 점포·입지 보조 분석

행: -컬럼: -정규화: -

URL: https://www.data.go.kr/catalog/15012005/openapi.json

경기기업비서 · 경기도경제과학진흥원

경기도 기업지원사업 공고

대기

허브 역할: 공고 요건 활용 사례, 공고 요건 분석

행: -컬럼: -정규화: -

URL: https://www.egbiz.or.kr/sp/supportPrjOutsideList.do

Normalized Assets

정규화 산출물

normalized_programs.csv

598

지원정책·창업정보·산업지원·기업지원 공고 통합

normalized_places.csv

48

창업보육센터 위치·규모 표준화

market_population_indicators.csv

224,640

유동인구 장형 지표

market_card_sales.csv

10,825

카드소비 표준 지표

Spatial Hub

창업공간 연결

가천대학교

성남시 · 보육실 34

경기도 성남시

동국대학교

고양시 · 보육실 24

경기도 고양시

KAIST-화성시 동탄 사이언스 허브

화성시 · 보육실 42

경기도 화성시

Market Hub

지역별 시장성 지표

수원시

창업공간 7

유동인구 레코드 11,520

카드매출 1,240,000,000

성남시

창업공간 7

유동인구 레코드 0

카드매출 0