박태원 프로필
AI서비스개발 · LLM · AI Engineer

AI 서비스의
동작 구조와 데이터 흐름을
직접 설계하고 구현했습니다.

복잡한 정보를 활용 가능한 인사이트 형태로 바꾸는 일 —
이게 제가 가장 많이 다룬 문제입니다.

LLM Fine-tuning RAG · Agent Prompt Engineering FastAPI · Docker
73%
LLM 토큰 비용 절감
71.24%
하차 정류장 예측 정확도
1
DCU × 하이투자증권 실전투자대회
직접 설계하고 배포한
AI 프로젝트들
문제 정의부터 운영까지 — 전체 사이클을 경험했습니다.
🏭
제조 AI Agent 플랫폼 — 아키텍처 및 데이터·Agent 파이프라인 설계·개발 주도
2025.12 ~ 현재 · 스마트제조혁신기술개발 과제 · FastAPI · VectorDB
진행중
문제 & 해결
  • 섬유·염색 제조업체 수기/비정형 공정 문서 전산화 — DeepSeek-OCR 기반 이미지 전산화 + PDF/Docx/Excel/HWP 파싱
  • 비정형 → VectorDB(OpenSearch), 정형 → RDB(PostgreSQL) 이중 적재. Text-to-SQL 연동으로 정형 데이터 자연어 조회 지원
  • 청킹 전략: 문단 단위 분할 + 도서관 분류 체계 구조 (대·중·소제목 카테고리, 핵심 키워드·요약을 메타데이터로 저장)
  • Sub Agent Builder: Tool·Prompt·Parameter·예상 입출력 직접 설정 → 앞선 Agent 출력이 다음 Agent 입력으로 자동 연결. Nginx 리버스 프록시 구성 후 폐쇄망 배포
성과
1
설계 → 데모 → 배포 전체 사이클 주도
설계 → 데모 → 배포 전체 사이클 완료
모르는 영역(백엔드·Multi-Tenant) 원리부터 직접 구현
LLM Agent RAG VectorDB Text-to-SQL FastAPI Docker PostgreSQL Nginx
⚙️
YOLO Analog Gauge Detection
2025.03 ~ 04 · YOLO · Computer Vision · PyTorch
완료
주요 작업
  • Gauge 영역 → Needle·눈금 Detection → 바늘 끝점(Tip)·기저점(Base)·최대·최솟값 중심점 탐지
  • Base·최솟값·최댓값 좌표로 각도 범위 계산 → Tip 끝점 각도를 게이지 수치로 선형 치환
  • 카메라 탑재 로봇 순회 환경 → 감지 시 정확도 집중 설계. 총 368개 테스트 데이터 구축, 116개 게이지 인식 이미지 검증
성과
%
게이지 인식 이미지 116개 중 97개 정확 인식 (Accuracy 83.62%)
YOLO Object Detection Computer Vision PyTorch
🚌
버스 하차 예측 & 교통혼잡도 예측 모델
2025.05 ~ 11 · 도심융합특구 과제 · Conv-LSTM · GBDT · Kafka
완료
문제 & 해결
  • 하차 미태깅률 약 30% → Trip-Chain 분석으로 승객별 이동 패턴 추출. 입력 피처: 유동인구·거주인구·기상·POI 7종 (유동인구·주거지·교육시설이 예측력 기여도 상위)
  • GBDT 기반 분류 모델 + 피처 엔지니어링 → Accuracy 71.24% (MAE 3.9)
  • Conv-LSTM으로 격자(공간) + 시간 정보 동시 학습 (5분 단위, 앞뒤 2개 Link 연결). 교차로 다중 링크 평균 처리로 논문 대비 RMSE 7.52 → 5.25 개선
  • Kafka + Spark 실시간·배치 겸용 파이프라인 구축, MLFlow 실험 이력 관리 + 가상 버스 시뮬레이션 시각화
성과
%
하차 정류장 예측 Accuracy 71.24% (MAE 3.9 / RMSE 5.25)
Conv-LSTM 혼잡도 RMSE 7.52 → 5.25 (교차로 처리 방식 개선)
가상 버스 시뮬레이션 시각화까지 확장 구현
Conv-LSTM GBDT Kafka Spark MLFlow Time-Series
💬
아이문화패스 챗봇 — LLM 토큰 비용 73% 절감
2025.04 · 울산시 공공 서비스 · 예상 사용자 62,000명
✓ 운영중
문제 & 해결
  • 질의마다 전체 FAQ를 프롬프트에 삽입 → 예상 월 토큰 비용 300만원 · 응답 포맷 불균일 문제 발생
  • OpenSearch Hybrid Search 적용 (Vector + Keyword 결합) → 질의와 유사한 FAQ만 선별 주입, Soft Coding으로 전환
  • 한국어 질의 → 영어 프롬프트 변환 레이어 추가 (한국어가 영어 대비 토큰 소비 多 — 논문 근거 확인 후 적용)
  • Few-shot Prompting 5개 설정으로 핵심 FAQ 유형별 응답 규칙 고정, 자연어 질의 대응 범위 확장
성과
300만 → 80만원 토큰 비용 73% 절감
고정 응답 → 자연어 질의응답으로 전환
모델 교체 없이 구조 개선만으로 달성
OpenAI API OpenSearch Hybrid Search RAG Few-shot Prompting Cost Optimization
🗺️
왔어울산 AI 여행 플래너 및 지능형 검색 고도화
2025.11 ~ 12 · LLM · RAG · OpenSearch · LangChain
완료
해결 방법
  • 일정 생성: LLM이 날짜 계산·출발/도착지·영업시간+이동시간+체류시간 종합 처리 — 고정값 없이 자연어 입력 기반 유동적 파라미터 추출
  • 이동시간 계산: 3km 이내 시속 30km 고정, 3km 이상 Naver 길찾기 API 활용 + 10% 여유 시간 가산
  • 추천 로직: RAG 검색 → 개인 성향 태그 가중치로 Ranking Score 산출 → Main Point 기준 15km 반경 클러스터링, 70점 미만 시 인접 POI로 자동 보완
  • OpenSearch 기반 문화행사 지능형 검색 + 블로그·유튜브 콘텐츠 연계
성과
고정 파라미터 기반 일정 → 자연어 입력 기반 완전 유동적 일정 생성으로 전환
이동 가능성·영업시간을 고려한 현실적 여행 일정 자동 생성 구현
LLM RAG OpenSearch LangChain Clustering Ranking Naver API
🌊
U-NET 기반 도심 침수 예측 모델 개발
2025.04 ~ 07 · PyTorch · Triton Inference Server · GIS
완료
해결 방법
  • 입력: 불투수율(토지피복도 기반) + DEM 파생 6채널 (지형방향성 Sin/Cos, 지형 곡률, 함몰 깊이, 유입면적×경사도 가중치). 타겟: 침수 흔적도 최대 침수심
  • 서빙 최적화: FastAPI 서빙 batch 4 기준 예측 16분 → TensorRT 변환 후 24초 (약 160배 속도 개선) → Triton Inference Server 기반 배포
  • 모델 설계: 침수 미탐지 비용 > 비침수 오탐지 비용 → Accuracy보다 Recall 중심 설계로 미연의 사고 방지 우선
성과
%
Validation Accuracy 96.98% | 부산 전 지역 전처리 + 예측 약 78초
TensorRT 적용으로 FastAPI 대비 약 160배 속도 개선 — 실시간 예측 가능 구조
U-NET PyTorch TensorRT Triton Inference Server GIS 공간 데이터
👔
VLM 기반 착장을 통한 직업 유추
2025.11 · CV · VLM · Prompt Engineering
완료
주요 작업
  • YOLO v8로 의상 Segmentation → Segmented 이미지를 VLM(Qwen2-VL-7B-Instruct)에 전달
  • 직업 카테고리별 의상 힌트를 프롬프트로 제공 → 힌트 기반 직업 유추 출력
  • 정확도보다 행사 콘텐츠로서의 체험성을 목표로 설계 — 울산 WAVE 행사, 2일 단기 개발
성과
📸
YOLO v8 Segmentation + Qwen2-VL-7B 파이프라인 2일 내 완성 — 울산 WAVE 행사 현장 전시·체험
단일 파이프라인으로 Detection → Segmentation → VLM 추론 end-to-end 구현
YOLO v8 Segmentation VLM Qwen2-VL-7B Prompt Engineering
🎙️
음성인식 기반 효과적인 전술 명령 시스템
2023.11 ~ 12 · Wav2Vec · Whisper · Audio Denoising
완료
주요 작업
  • 전장 환경 노이즈 제거를 위한 Audio Denoising 전처리 후 음성 인식 파이프라인 구성
  • Wav2Vec vs Whisper 비교 실험 — CER(Character Error Rate) 기준 Whisper 우위를 논문으로 확인 후 Whisper 채택
  • 군사 전술 명령어 특화 파이프라인 구축, 기여도 70%
성과
CER(Character Error Rate) 약 0.65 달성
Wav2Vec Whisper Audio Denoising NLP
기술 스택
졸업 시점 CNN·DNN → 1년 내 LLM·Agent·FastAPI·Docker 실서비스 적용
🧠 LLM / NLP
Prompt Engineering실무 경험
RAG · OpenSearch실무 경험
LangChain · LlamaIndex프로젝트
LoRA Fine-tuning프로젝트
Agent (ReAct / Tool Use)실무 경험
⚙️ ML Framework
PyTorch실무 경험
Scikit-learn실무 경험
LSTM / Conv-LSTM프로젝트
GBDT프로젝트
U-NET · VLM · YOLO프로젝트
🛠️ Backend / Infra
FastAPI실무 경험
Docker실무 경험
PostgreSQL · VectorDB실무 경험
Kafka · Spark프로젝트
MLFlow · Linux · Nginx실무 경험
이력 & 활동
💼
2025.03 ~ 현재
㈜에이테크 · AI솔루션개발팀 사원
LLM / Agent 기반 AI 서비스 설계~배포 전 과정 담당. 공공·제조·모빌리티 도메인.
도심융합특구, 스마트제조혁신기술개발, 왔어울산 등 과제 사업 참여.
🏆
2021.06
DCU × 하이투자증권 실전투자대회 1위 · 상금 50만원
금융 AI 개발 동기의 출발점. 뉴스·수급·차트 맥락을 종합하는 의사결정 로직을 실전에서 검증.
실전투자대회 1위 시상식
🚀
2020 ~ 2021
창업동아리 · 창업경진대회 대상 · G-STAR 장려상
학생창업유망팀 300 선정 (교육부 / 과학기술정보통신부, 2020.08)
교내 창업경진대회 대상 (대구가톨릭대학교, 2021.09)
G-STAR 대학생 창업경진대회 장려상 (경북창조경제혁신센터, 2021.10)
창업동아리
G-STAR 창업경진대회
📚
2021.03 ~ 2021.07
하이투자 아카데미 수료
대구가톨릭대학교 × 하이투자증권 · 금융인재양성 과정
✈️
2021.12 ~ 2022.01
IoT 교육 및 어학연수
University of Nevada, Las Vegas (UNLV)
🪖
2022.07 ~ 2024.01
육군 병장 만기전역 · 견인차량운전병
특수(대형견인) 운전면허 취득. 모빌리티 도메인에 대한 실질적 관심의 배경.
🎓
2019 ~ 2025
대구가톨릭대학교 AI빅데이터공학전공
GPA 3.77 / 4.5 · 효성캠퍼스
빅데이터분석기사 (2023.07) · 컴퓨터활용능력 2급 (2023.09)