박태원 · AI서비스개발

Projects

직접 설계하고 배포한
AI 프로젝트들

문제 정의부터 운영까지 — 전체 사이클을 경험했습니다.

🏭

제조 AI Agent 플랫폼 — 아키텍처 및 데이터·Agent 파이프라인 설계·개발 주도

2025.12 ~ 현재 · 스마트제조혁신기술개발 과제 · FastAPI · VectorDB

진행중

문제 & 해결

섬유·염색 제조업체 수기/비정형 공정 문서 전산화 — DeepSeek-OCR 기반 이미지 전산화 + PDF/Docx/Excel/HWP 파싱
비정형 → VectorDB(OpenSearch), 정형 → RDB(PostgreSQL) 이중 적재. Text-to-SQL 연동으로 정형 데이터 자연어 조회 지원
청킹 전략: 문단 단위 분할 + 도서관 분류 체계 구조 (대·중·소제목 카테고리, 핵심 키워드·요약을 메타데이터로 저장)
Sub Agent Builder: Tool·Prompt·Parameter·예상 입출력 직접 설정 → 앞선 Agent 출력이 다음 Agent 입력으로 자동 연결. Nginx 리버스 프록시 구성 후 폐쇄망 배포

성과

설계 → 데모 → 배포 전체 사이클 주도

∞

설계 → 데모 → 배포 전체 사이클 완료

↑

모르는 영역(백엔드·Multi-Tenant) 원리부터 직접 구현

LLM Agent RAG VectorDB Text-to-SQL FastAPI Docker PostgreSQL Nginx

⚙️

YOLO Analog Gauge Detection

2025.03 ~ 04 · YOLO · Computer Vision · PyTorch

완료

주요 작업

Gauge 영역 → Needle·눈금 Detection → 바늘 끝점(Tip)·기저점(Base)·최대·최솟값 중심점 탐지
Base·최솟값·최댓값 좌표로 각도 범위 계산 → Tip 끝점 각도를 게이지 수치로 선형 치환
카메라 탑재 로봇 순회 환경 → 감지 시 정확도 집중 설계. 총 368개 테스트 데이터 구축, 116개 게이지 인식 이미지 검증

성과

게이지 인식 이미지 116개 중 97개 정확 인식 (Accuracy 83.62%)

YOLO Object Detection Computer Vision PyTorch

🚌

버스 하차 예측 & 교통혼잡도 예측 모델

2025.05 ~ 11 · 도심융합특구 과제 · Conv-LSTM · GBDT · Kafka

완료

문제 & 해결

하차 미태깅률 약 30% → Trip-Chain 분석으로 승객별 이동 패턴 추출. 입력 피처: 유동인구·거주인구·기상·POI 7종 (유동인구·주거지·교육시설이 예측력 기여도 상위)
GBDT 기반 분류 모델 + 피처 엔지니어링 → Accuracy 71.24% (MAE 3.9)
Conv-LSTM으로 격자(공간) + 시간 정보 동시 학습 (5분 단위, 앞뒤 2개 Link 연결). 교차로 다중 링크 평균 처리로 논문 대비 RMSE 7.52 → 5.25 개선
Kafka + Spark 실시간·배치 겸용 파이프라인 구축, MLFlow 실험 이력 관리 + 가상 버스 시뮬레이션 시각화

성과

하차 정류장 예측 Accuracy 71.24% (MAE 3.9 / RMSE 5.25)

↓

Conv-LSTM 혼잡도 RMSE 7.52 → 5.25 (교차로 처리 방식 개선)

→

가상 버스 시뮬레이션 시각화까지 확장 구현

Conv-LSTM GBDT Kafka Spark MLFlow Time-Series

💬

아이문화패스 챗봇 — LLM 토큰 비용 73% 절감

2025.04 · 울산시 공공 서비스 · 예상 사용자 62,000명

✓ 운영중

문제 & 해결

질의마다 전체 FAQ를 프롬프트에 삽입 → 예상 월 토큰 비용 300만원 · 응답 포맷 불균일 문제 발생
OpenSearch Hybrid Search 적용 (Vector + Keyword 결합) → 질의와 유사한 FAQ만 선별 주입, Soft Coding으로 전환
한국어 질의 → 영어 프롬프트 변환 레이어 추가 (한국어가 영어 대비 토큰 소비 多 — 논문 근거 확인 후 적용)
Few-shot Prompting 5개 설정으로 핵심 FAQ 유형별 응답 규칙 고정, 자연어 질의 대응 범위 확장

성과

↓

300만 → 80만원 토큰 비용 73% 절감

→

고정 응답 → 자연어 질의응답으로 전환

★

모델 교체 없이 구조 개선만으로 달성

OpenAI API OpenSearch Hybrid Search RAG Few-shot Prompting Cost Optimization

🗺️

왔어울산 AI 여행 플래너 및 지능형 검색 고도화

2025.11 ~ 12 · LLM · RAG · OpenSearch · LangChain

완료

해결 방법

일정 생성: LLM이 날짜 계산·출발/도착지·영업시간+이동시간+체류시간 종합 처리 — 고정값 없이 자연어 입력 기반 유동적 파라미터 추출
이동시간 계산: 3km 이내 시속 30km 고정, 3km 이상 Naver 길찾기 API 활용 + 10% 여유 시간 가산
추천 로직: RAG 검색 → 개인 성향 태그 가중치로 Ranking Score 산출 → Main Point 기준 15km 반경 클러스터링, 70점 미만 시 인접 POI로 자동 보완
OpenSearch 기반 문화행사 지능형 검색 + 블로그·유튜브 콘텐츠 연계

성과

✓

고정 파라미터 기반 일정 → 자연어 입력 기반 완전 유동적 일정 생성으로 전환

→

이동 가능성·영업시간을 고려한 현실적 여행 일정 자동 생성 구현

LLM RAG OpenSearch LangChain Clustering Ranking Naver API

🌊

U-NET 기반 도심 침수 예측 모델 개발

2025.04 ~ 07 · PyTorch · Triton Inference Server · GIS

완료

해결 방법

입력: 불투수율(토지피복도 기반) + DEM 파생 6채널 (지형방향성 Sin/Cos, 지형 곡률, 함몰 깊이, 유입면적×경사도 가중치). 타겟: 침수 흔적도 최대 침수심
서빙 최적화: FastAPI 서빙 batch 4 기준 예측 16분 → TensorRT 변환 후 24초 (약 160배 속도 개선) → Triton Inference Server 기반 배포
모델 설계: 침수 미탐지 비용 > 비침수 오탐지 비용 → Accuracy보다 Recall 중심 설계로 미연의 사고 방지 우선

성과

Validation Accuracy 96.98% | 부산 전 지역 전처리 + 예측 약 78초

⚡

TensorRT 적용으로 FastAPI 대비 약 160배 속도 개선 — 실시간 예측 가능 구조

U-NET PyTorch TensorRT Triton Inference Server GIS 공간 데이터

👔

VLM 기반 착장을 통한 직업 유추

2025.11 · CV · VLM · Prompt Engineering

완료

주요 작업

YOLO v8로 의상 Segmentation → Segmented 이미지를 VLM(Qwen2-VL-7B-Instruct)에 전달
직업 카테고리별 의상 힌트를 프롬프트로 제공 → 힌트 기반 직업 유추 출력
정확도보다 행사 콘텐츠로서의 체험성을 목표로 설계 — 울산 WAVE 행사, 2일 단기 개발

성과

📸

YOLO v8 Segmentation + Qwen2-VL-7B 파이프라인 2일 내 완성 — 울산 WAVE 행사 현장 전시·체험

✓

단일 파이프라인으로 Detection → Segmentation → VLM 추론 end-to-end 구현

YOLO v8 Segmentation VLM Qwen2-VL-7B Prompt Engineering

🎙️

음성인식 기반 효과적인 전술 명령 시스템

2023.11 ~ 12 · Wav2Vec · Whisper · Audio Denoising

완료

주요 작업

전장 환경 노이즈 제거를 위한 Audio Denoising 전처리 후 음성 인식 파이프라인 구성
Wav2Vec vs Whisper 비교 실험 — CER(Character Error Rate) 기준 Whisper 우위를 논문으로 확인 후 Whisper 채택
군사 전술 명령어 특화 파이프라인 구축, 기여도 70%

성과

↓

CER(Character Error Rate) 약 0.65 달성

Wav2Vec Whisper Audio Denoising NLP

AI 서비스의동작 구조와 데이터 흐름을직접 설계하고 구현했습니다.

AI 서비스의
동작 구조와 데이터 흐름을
직접 설계하고 구현했습니다.