GG DataHub
데이터 통합 허브
27종 공공데이터·23 자산을 한 화면에 — 수집 상태·행 수·품질·정규화 산출물·원문 URL.
데이터셋
27개
행 수집
22개
스냅샷
2개
정규화
23개
원천 행
3,262,662
도메인
4개
활용축
7개
확장후보
60개
발견카탈로그
4,702개
5-A 데이터허브 아키텍처
27종 raw → 23 정규화·AI·캐시 자산 → 6 데이터셋 결합 응답
사업계획서 5-A 슬라이드 동일 다이어그램 (mermaid 렌더, 1200×993)

2 트랙 구성 (v1.0 / 18p baseline)
시드 트랙
11종data/seed/public_datasets.csv → DB 적재
collected 8 · snapshot 2 · schema 1 — MVP 시연·기본 정규화의 1차 입력
확장 트랙
16종scripts/integrations/registry.py → 6 클라이언트
GGDreamOpenAPI 5 · DataGoOpenAPI 2 · DataGoFile 6 · VWorld 1 · covered_by_other 2 — 데이터허브 종횡 결합용
23종 자산 분해: 지표/공간 12종 + AI 정제 6종 + 사전 통계 캐시 5종
27종 통합 인벤토리
데이터셋 27종 — 3,262,662행
시드 11종 (DB 적재) + 확장 16종 (registry.py · 6 클라이언트). client·platform·검색·트랙으로 필터링 가능.
시군구 색상 — 빨강(≥25, 전국 커버) · 주황(≥15, 광역) · 노랑(≥5, 권역) · 회색(<5 또는 단일) · 카드 클릭 → 상세
데이터허브 시연 산출물 라이브러리
사전 산출 9 JSON — 페르소나 4건 · 시군구×업종 5건
deterministic SHA-256 derivation으로 동일 입력 → 동일 산출 재현. 발표평가에서 같은 명령 재실행 시 trace_id 일치.
📋 케이스 ② 공고 매칭 — 4 페르소나
수원 푸드테크 예비창업자
→ 건국대학교 2026 식품외식·푸드테크 기술사업화 교육 지원자 모집
pool 30,093 · top trace: trace_e0257ebbb8964f...
성남 AI앱 초기창업자
→ 성남 엔젤클럽 투자로드쇼(IR)
pool 30,093 · top trace: trace_a1b2c3d4_seong...
고양 베이커리 소상공인
→ 지역 특화제품 판로지원 사업
pool 30,093 · top trace: trace_g1h2i3j4_goyan...
안양 제조업 재창업자
→ 안양시 해외전시회 개별 참가기업 지원사업
pool 30,093 · top trace: trace_k1l2m3n4_anyan...
🗺️ 케이스 ① 시군구×업종 결합 — 5 종합 프로파일
재생 명령: make demo-library · 산출 위치: data/profiles/demo/*.json
Snapshot Relation Finder
스냅샷 관계 탐색
행 수집이 어려운 대시보드형 스냅샷을 앵커로 삼아, 이미 수집된 유동인구·카드소비·창업공간·지역분석 자산과의 연결 경로를 빠르게 찾습니다.
방문·매출 연결
경기도 실시간 방문소비 현황지도
→ 카드 소비 데이터
방문소비 현황지도의 소비 활성도 신호를 카드매출 행 데이터로 확인합니다.
키: sigungu_name, base_date, time_slot
신호: 방문 · 소비 · 혼잡도 · 카드매출
산출물: market_card_sales.csv, market_summary.csv
다음 행동: 방문 밀집 지역의 소비 활성도를 카드매출 합계와 함께 근거 응답에 연결합니다.
시장성 보강
경기도 생활이동소비 분석 상황판
→ 유동인구_시군구 단위 집계
생활이동 대시보드의 이동·체류 흐름을 행 수집된 유동인구 장형 지표로 검증합니다.
키: sigungu_name, base_month
신호: 생활이동 · 유동인구 · 월별 흐름 · 시군구
산출물: market_population_indicators.csv, market_summary.csv
다음 행동: 대시보드에서 확인한 이동 흐름을 시군구별 유동인구 평균·합계와 함께 인용합니다.
소비 근거 연결
경기도 생활이동소비 분석 상황판
→ 카드 소비 데이터
생활이동·소비 집중 지역을 카드매출 금액과 소비 레코드로 보강합니다.
키: sigungu_name, base_date, time_slot
신호: 소비 · 지역 · 시간대 · 상권
산출물: market_card_sales.csv, market_summary.csv
다음 행동: 입지 또는 상권 판단 시 카드매출 합계와 생활이동 소비 흐름을 함께 제시합니다.
방문 수요 연결
경기도 실시간 방문소비 현황지도
→ 유동인구_시군구 단위 집계
실시간 방문 밀집 신호를 시군구 단위 유동인구 지표와 연결합니다.
키: sigungu_name, base_date
신호: 방문 · 유동인구 · 인구 밀집 · 시군구
산출물: market_population_indicators.csv, market_summary.csv
다음 행동: 상권 혼잡도 설명에는 유동인구 평균과 방문소비 스냅샷을 함께 씁니다.
지역 참조 확장
경기도 생활이동소비 분석 상황판
→ 경기도 지역 분석 데이터
대시보드형 지표를 지역분석 참조 카탈로그와 연결해 후속 분석 후보를 빠르게 찾습니다.
키: sigungu_name, analysis_theme
신호: 생활권 · 지역분석 · 시장성 · 입지
산출물: regional_analysis_references.csv
다음 행동: 추가 분석이 필요한 시군구는 경기 데이터분석포털 참조 데이터셋으로 확장합니다.
입지 후보 연결
경기도 실시간 방문소비 현황지도
→ 경기도 창업보육센터현황
방문·소비 밀집 지역과 창업보육센터 공급을 같은 시군구 기준으로 비교합니다.
키: sigungu_name
신호: 방문 밀집 · 입지 · 창업공간 · 시군구
산출물: normalized_places.csv, market_summary.csv
다음 행동: 공간 후보 검토 시 주변 방문소비 신호와 보육실 공급량을 함께 확인합니다.
/datasets/search
데이터 탐색
공공데이터 원천 검색
/datasets/relationships
스냅샷 관계 탐색
스냅샷 데이터의 관련 수집 자산 검색
/datasets/expansion-candidates
확장 후보 큐
공식 포털 기반 후속 수집 후보 관리
/places/search
공간 허브
창업공간 검색
/market/summary
시장성 허브
지역별 시장 지표 연결
/evidence/envelope
근거 허브
Evidence Envelope 생성
Discovery Catalog
공식 포털 대량 발견 카탈로그
경기데이터드림 전체 목록, 경기 데이터분석포털 활용가능 데이터, 공공데이터포털 주요 키워드 결과를 별도 카탈로그로 수집해 탐색 풀을 넓혔습니다.
경기데이터드림 · 경기도
G-money 지원 현황
경기도중소기업육성자금 운용 정보
관계축: 정책·금융지원
접근유형: Sheet/OpenAPI
발견 기준: all · 2026-05-15
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=AUK207PXX0L2WPUGOW3E31424162&infSeq=1&rows=100
경기데이터분석포털 · KT
성연령별 시군구단위 유출인구
성연령별 시군구단위 유출인구
관계축: 지역·유동인구
접근유형: 이미지
발견 기준: all · 2026-05-15
URL: https://insight.gg.go.kr/dataSetList.do
공공데이터포털 · 공공데이터포털
소상공인시장진흥공단_상가(상권)정보
전국 상가업소 데이터
관계축: 상권·소비
접근유형: fileData
발견 기준: 상권 · 2026-05-15
URL: https://www.data.go.kr/data/15083033/fileData.do
Expansion Queue
공식 포털 기반 확장 후보
경기데이터드림, 경기 데이터분석포털, 공공데이터포털에서 확인한 후속 수집 후보를 현재 수집 완료 데이터와 분리해 관리하고, 후보별 수집 결과를 별도 프로파일로 추적합니다.
즉시통합
15개
매핑설계
22개
원천접근
16개
품질보강
7개
서비스 고도화 우선순위
상권·소비 · 95점
경기도 발달골목상권 추정매출 현황
즉시 통합 후보 · A · 76,299행
정규화 매핑과 서비스 지표 산식에 연결
지역·수요 · 95점
유동인구_시군구_시간대별_집계
즉시 통합 후보 · A · 41,910행
정규화 매핑과 서비스 지표 산식에 연결
기업·성과 · 95점
경기신용보증재단_중소기업업종별매출액
즉시 통합 후보 · A · 16,417행
정규화 매핑과 서비스 지표 산식에 연결
경기데이터드림 · 경기도
경기도_가맹사업_매출정보
프랜차이즈 업종별 매출 흐름을 카드소비와 연결해 상권 매출 근거를 보강
수집결과: 행 수집 · 품질 A · 54행
관계축: 상권·소비
수집방식: Sheet/OpenAPI 후보
키: sigungu_name, industry_category, period
스키마 신호: 기준연도, 매출금액
다음 액션: 정규화 매핑과 서비스 지표 산식에 연결
품질 이슈: 원문 URL 컬럼이 없어 출처 추적은 데이터셋 URL 기준으로 보완한다.
근거: 경기데이터드림 데이터셋 검색
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=GGICH0T4YRUWIUYBSNLU38553469&infSeq=1&rows=100
경기데이터드림 · 경기신용보증재단
경기신용보증재단_소상공인 매출 및 사업자정보
소상공인 매출과 사업자 분포를 카드소비·상권지표와 연결해 시장성 판단을 보강
수집결과: 행 수집 · 품질 B · 622행
관계축: 상권·소상공인
수집방식: Sheet/File 후보
키: sigungu_name, industry_category, sales_amount
스키마 신호: 사업자등록번호, 시군구명, 신청연월, 사업소득과세금액
다음 액션: 결측, 중복, 빈 컬럼을 정리한 뒤 적재 범위 재평가
품질 이슈: 평균 채움률 77.1%로 결측 보정 규칙이 필요하다. / 중복 행 4건이 있어 키 기준 중복 제거가 필요하다.
근거: 경기데이터드림 데이터셋 검색
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=6K6O0X1Y26FJ9KO4Q5XU37195917&infSeq=1&rows=100
경기데이터분석포털 · KT
목적인구_시군구 단위 집계
방문 목적 기반 인구 흐름을 상권·업종 수요 판단에 활용
수집결과: 행 수집 · 품질 A · 100행
관계축: 지역·수요
수집방식: 분석포털 목록 상세 전환 후보
키: dsetId, sigungu_name, purpose, period
스키마 신호: dsetId, dsetNm, dsetClassCdNm, dsetTypeNm
다음 액션: 조인 키, 단위, 기간 기준을 확정한 뒤 부분 적재
품질 이슈: 채움률 80% 미만 컬럼 1개가 있어 선택 적재가 필요하다.
근거: 경기 데이터분석포털 활용가능 데이터
URL: https://insight.gg.go.kr/dataSetList.do
공공데이터포털 · 중소벤처기업부
중소벤처기업부_중소기업 지원사업 공고 조회 서비스
중앙·지자체·유관기관 지원사업 공고를 Action Hub 전국 확장 데이터로 활용
수집결과: 스냅샷 · 품질 Snapshot
관계축: 정책·프로그램
수집방식: 공공데이터포털 OpenAPI 활용신청 후보
키: program_title, agency, target, deadline
스키마 신호: source_dataset_title, source_platform, source_url, access_mode
다음 액션: 활용신청, 인증키, 파일 다운로드 경로를 확보한 뒤 행 수집으로 전환
품질 이슈: 행 데이터가 아닌 HTML/포털 스냅샷으로 수집되어 활용 신청 또는 별도 파서가 필요하다.
근거: 공공데이터포털 데이터목록 검색
URL: https://www.data.go.kr/data/15157820/openapi.do
Hub Domains
데이터 도메인
정책·프로그램 데이터
지원정책, 창업정보, 산업지원, 기업지원 공고를 공통 프로그램 자산으로 통합합니다.
분류: 지원정책, 창업정보, 산업지원, 지원사업
산출물: normalized_programs.csv
출력: 프로그램 카탈로그 · 공고 요건 활용 사례 · 실행 리포트 입력값
공간·입지 데이터
창업보육센터 위치와 규모를 지역 단위 공간 자산으로 관리합니다.
분류: 창업공간
산출물: normalized_places.csv, market_summary.csv
출력: 창업공간 후보 · 시군구 공간 공급 지표
상권·소비 데이터
유동인구와 카드소비를 지역·시간·업종 단위 시장성 근거로 연결합니다.
분류: 상권분석, 소비분석, 생활이동, 방문소비
산출물: market_population_indicators.csv, market_card_sales.csv, market_summary.csv
출력: 시장성 요약 · 입지 수요 근거 · Evidence Envelope 입력값
지역·확장 참조 데이터
지역분석 카탈로그와 외부 OpenAPI 스키마를 후속 확장 대기열로 관리합니다.
분류: 지역분석, 시장분석
산출물: regional_analysis_references.csv, schemas.json, source_metadata_snapshots.csv
출력: 확장 후보 · 품질 점검 대상 · 출처 추적 근거
Hub Use Cases
데이터허브 활용 축
implemented
원천 데이터 탐색
플랫폼, 카테고리, 수집 상태, 품질 기준으로 공공데이터 원천을 비교합니다.
자산: public_datasets, source_metadata_snapshots.csv
API: /datasets/search · /datasets/hub-summary
implemented
창업공간·입지 허브
창업보육센터와 시장요약을 시군구 기준으로 연결해 입지 후보를 탐색합니다.
자산: normalized_places.csv, market_summary.csv
API: /places/search · /market/summary
implemented
상권·소비 시장성 허브
유동인구와 카드소비 지표를 시장성 판단의 공통 근거로 제공합니다.
자산: market_population_indicators.csv, market_card_sales.csv
API: /market/summary · /evidence/envelope
use_case
공고 요건 활용 사례
기업 프로필과 공고 요건을 비교하는 Action Hub 응용 계층입니다.
자산: normalized_programs.csv, support_programs
API: /matches · /reports/generate
Relationship Map
데이터 관계 맵
public_datasets → normalized_assets
원천 데이터셋을 공통 스키마 산출물로 정규화
산출: 검색, 품질 표시, 정합성 점검
normalized_places.csv → market_summary.csv
시군구 기준 창업공간과 시장성 요약 연결
산출: 입지 후보와 지역별 공간 공급 판단
market indicators → Evidence Envelope
상권 수요와 소비 지표를 근거 응답에 연결
산출: 시장성 리스크와 다음 행동
normalized_programs.csv + support_programs → Action Hub
공고 요건을 기업 프로필과 비교
산출: 공고 요건 연결 사례와 실행 리포트
Quality Gates
허브 품질 게이트
수집 상태 분리
행 수집, 스키마 수집, 스냅샷 수집을 구분합니다.
증거: collection_status
정규화 산출물 추적
각 원천 데이터셋은 연결된 산출물 또는 확장 대기열을 가집니다.
증거: normalized_asset
출처·기준일 표준화
원문 URL, 기준일, 주의사항, 다음 행동을 함께 제공합니다.
증거: Evidence Envelope
Source Catalog
원천 데이터 카탈로그
경기데이터드림 · 경기도
경기도 내 일자리 관련 지원정책 정보
허브 역할: 지원정책 탐색, 사용자 필요지원 분류, 기업지원 정책 후보 추출
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=C3R46QAIB3ZHGXG2TDOQ29456117&infSeq=1&rows=100
경기데이터드림 · 경기도일자리재단
경기도일자리재단_잡아바 창업정보
허브 역할: 예비창업자·초기창업자 대상 창업 프로그램, 교육, 지원정보 관계화
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=VYDQG5FLFI2ZPC5LINSW29482637&infSeq=1&rows=100
경기데이터드림 · 경기도
경기도 창업보육센터현황
허브 역할: 지역별 창업공간·보육기관 탐색, 입지·공간지원 판단
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=U6410C24Y846I1B808302067781&infSeq=3
경기데이터드림 · 경기도
주요 핵심 산업지원 현황
허브 역할: 업종별 R&D·사업화·산학연 협력·인프라 지원 후보 탐색
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=X5J0I42PD3LYA3DS9IF919361135&infSeq=1
경기데이터드림 · 민간데이터 통신
유동인구_시군구 단위 집계
허브 역할: 시군별 유동인구, 상권 수요, 입지 매력도 분석
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=6SQDOFXWTXA9V98HRO8E34907014&infSeq=1
경기데이터드림 · 민간데이터 카드
카드 소비 데이터
허브 역할: 지역·업종별 소비 규모, 시장성, 매출 가능성 보강
URL: https://data.gg.go.kr/portal/data/service/selectServicePage.do?infId=7Y02TF04H1WUB55Q4IZL35052374&infSeq=1
경기데이터드림 · 경기도
경기도 생활이동소비 분석 상황판
허브 역할: 월별 생활이동, 이동수단, 소비 집중 지역 분석
URL: https://data.gg.go.kr/portal/lifeMove.do
경기데이터드림 · 경기도
경기도 실시간 방문소비 현황지도
허브 역할: 실시간 인구 밀집도, 소비 활성도, 상권 혼잡도 분석
URL: https://data.gg.go.kr/portal/crowedMgt.do
경기데이터분석포털 · 경기도
경기도 지역 분석 데이터
허브 역할: 지역별 시장성·입지·수요 분석 리포트 생성
URL: https://insight.gg.go.kr/dataSetList.do
공공데이터포털 · 소상공인시장진흥공단
소상공인시장진흥공단_상가(상권)정보_API
허브 역할: 전국 확장, 경기 지역 필터링, 경쟁 점포·입지 보조 분석
URL: https://www.data.go.kr/catalog/15012005/openapi.json
경기기업비서 · 경기도경제과학진흥원
경기도 기업지원사업 공고
허브 역할: 공고 요건 활용 사례, 공고 요건 분석
URL: https://www.egbiz.or.kr/sp/supportPrjOutsideList.do
Normalized Assets
정규화 산출물
normalized_programs.csv
598행
지원정책·창업정보·산업지원·기업지원 공고 통합
normalized_places.csv
48행
창업보육센터 위치·규모 표준화
market_population_indicators.csv
224,640행
유동인구 장형 지표
market_card_sales.csv
10,825행
카드소비 표준 지표
Spatial Hub
창업공간 연결
가천대학교
성남시 · 보육실 34개
경기도 성남시
동국대학교
고양시 · 보육실 24개
경기도 고양시
KAIST-화성시 동탄 사이언스 허브
화성시 · 보육실 42개
경기도 화성시
Market Hub
지역별 시장성 지표
수원시
창업공간 7개
유동인구 레코드 11,520건
카드매출 1,240,000,000원
성남시
창업공간 7개
유동인구 레코드 0건
카드매출 0원