Rona

Scikit-LLM 감성 분석 파이프라인 만들기

중급402026-06-16

IMDB 형식의 리뷰 CSV를 읽어 HTML 태그를 제거하고, Groq API 기반 Scikit-LLM 제로샷 분류기를 scikit-learn Pipeline에 연결해 positive/negative를 예측합니다. 최종적으로 classification_report 텍스트와 예측 결과가 담긴 CSV 파일을 저장하는 Python 파이프라인 스크립트를 만듭니다.

이 실습은 터미널에서 진행됩니다

이런 걸 배워요

  • Groq API 키를 안전하게 설정값 파일로 관리합니다
  • Scikit-LLM을 scikit-learn Pipeline에 연결합니다
  • HTML 태그 제거 전처리를 FunctionTransformer로 감쌉니다
  • fit/predict 흐름으로 제로샷 감성 분류를 실행합니다
  • 결과를 업무 리포트용 요약으로 정리합니다

어떻게 진행해요

1. 환경 호환성 확인
2. Groq 키 발급
3. 설정값 파일 준비
4. 필요 패키지 설치
5. IMDB 리뷰 CSV 준비
6. 감성 분류 코드 작성
7. 예측 결과 실행
8. 업무 리포트 요약

AI 튜터가 각 단계를 하나씩 안내해줄 거예요