본문 바로가기
성경 프로그램/AI tools

윈도우 11 환경에서 geminirag3.py 코드 실행하기

by 구봉환 2025. 12. 22.

D:\geminirag 폴더를 기준으로 실행하는 방법을 단계별로 안내해 드립니다. 이 폴더는 어디라도 상관없습니다.

 

1. Python 및 필수 구성 요소 설치

 

윈도우에 Python이 설치되어 있지 않다면 먼저 설치해야 합니다.

 

Python 설치: python.org에서 최신 버전(3.10 이상 권장)을 다운로드하여 설치합니다.
중요: 설치 화면 하단의 "Add Python to PATH" 체크박스를 반드시 선택하세요.


C++ 빌드 도구 (필요 시): chromadb나 sentence-transformers 설치 중 에러가 발생하면 Visual Studio 빌드 도구를 설치해야 할 수도 있습니다. - 비주얼 스튜디오 빌드 도구 중 "C++를 사용한 데스크톱 개발" (Desktop development with C++) 만 선택하고 설치해야 합니다.

 


비주얼 스튜디오 빌드 도구 설치 시 선택 옵션 (중요)


설치 화면이 나오면 아래와 같은 항목을 선택해야 합니다.
워크로드 탭: "C++를 사용한 데스크톱 개발" 항목에 체크하세요.
우측 세부 정보 (선택 사항 확인):
MSVC v143 - VS 2022 C++ x64/x86 빌드 도구 (최신 버전)
Windows 10/11 SDK
C++ CMake 도구

 

(설치 방법 요약)
Visual Studio 빌드 도구 다운로드 페이지로 이동합니다.
'Build Tools 다운로드' 버튼을 클릭하여 설치 파일을 실행합니다.
설치 프로그램이 실행되면 위에서 언급한 "C++를 사용한 데스크톱 개발"을 선택하고 우측 하단의 '설치' 버튼을 누릅니다.
설치가 완료되면 컴퓨터를 재부팅한 후, 다시 D:\geminirag 폴더에서 pip install ... 명령어를 실행하여 설치를 계속합니다.

 

2. 가상환경 구축 및 라이브러리 설치

터미널(PowerShell 또는 CMD)을 열고 아래 명령어를 순서대로 입력하세요.

PowerShell

1. 해당 폴더로 이동

d:
cd D:\geminirag

2. 가상환경 생성 (선택 사항이지만 권장)

python -m venv venv

3. 가상환경 활성화

.\venv\Scripts\activate

4. 필수 라이브러리 한 번에 설치

pip install PyQt6 PyQt6-WebEngine google-genai chromadb sentence-transformers PyPDF2 python-docx langchain-text-splitters


3. 코드 실행하기

라이브러리 설치가 완료되었다면 가상환경이 활성화된 상태에서 코드를 실행합니다.

PowerShell

python geminirag3.py


4. 프로그램 사용 방법 (RAG 설정)


프로그램이 실행되면 다음 순서로 세팅하여 사용하세요.  처음 실행 시 메모리 덤프 현상으로 다운되면 다시 실행하세요.

로그인: 우측 상단의 Gemini Setup 그룹에서 본인의 GEMINI_API_KEY를 입력하고 🔑 Login 버튼을 누릅니다. GEMINI API KEY 로 로그인 하지 않아도 라그 프롬프트는 생성됩니다. 이 내용을 우측 창에 붙여넣고 제출하면 해당 LLM 이 응답합니다.

 

컬렉션 생성: 1. Manage Collections에서 이름을 입력하고 Add New를 눌러 문서를 담을 방(Collection)을 만듭니다. 이 때 Collection 이 선택되어 있고 우측에는 이 컬렉션이 속하는 Group 이름이 드롭다운 박스 안에 표시됩니다. 박스 우측 선택버튼을 눌러 다름 그룹을 선택할 수 있습니다. 초기값으로 제공된 그룹 외에 다른 그룹을 만들려면 왼쪽의 Group 을 선택하고 그 위의 입력 상자에 그룹명을 입력하고나서 Add New 버튼을 누르면 그룹이 추가됩니다.

 

Delete Selected 버튼을 누르면 Indexing Target 아래 Index To: 우측 박스에 선택된 컬렉션이 완전 삭제됩니다. 이때 해당 컬렉션 하위로 인덱싱했던 파일들도 함께 삭제되므로 조심해야 합니다. 그룹은 삭제할 수 없습니다. 만일 삭제하려면 코드를 수정해야 합니다.

파일 추가: 2. Add File(s) 버튼을 눌러 분석할 PDF, DOCX, TXT 파일을 선택합니다. (이때 하단 상태바에 인덱싱 과정이 표시됩니다.) 인덱싱시 RAG 권장 설정값을 참고하여 인덱싱할 자료의 성격에 맞게 조정할 수 있습니다.

 

인덱싱할 파일을 일정한 크기(Chunk Size)로 잘라서 문맥과 텍스트를 저장하고, 이 크기로 자를 때 앞 청크와 뒤 청크가 일정한 크기로 중복되어 의미가 단절되는 것을 막는 것이 Overlap 값입니다. 보통 크기의 20%를 설정합니다.
그리고 문맥을 검색하여 가져올 청크의 개수가 K값입니다. K값이 클수록 더 정확하게 RAG 검색이 되지만 그만큼 시간과 컴퓨터의 자원이 소모됩니다.
보통 일반문서는 [500-100-3], 학술문서는 [1000-200-5] 정도 설정합니다.

 

검색 대상 선택: 3. Search Collections에서 질문할 때 참고할 컬렉션을 체크합니다. 여러 개의 컬렉션을 선택하면 해당하는 모든 파일들을 종합하여 검색하여 통합된 컨텍스트를 작성합니다. 대신 시간이 더 소요됩니다.

질문하기: 질문을 입력하고 4. Run RAG 버튼을 누르면 RAG Prompt (Input)에 내용이 기록되고 이 컨텍스트와 질문에 대해 Gemini가 문서를 분석하여 Gemini Response (Ourput) 란에 답변을 출력합니다. API 로그인을 하지 않은 경우는 기록되지 않습니다.

 

💡 실행 시 주의사항

로그 확인: 실행 중 발생하는 I/O 내역은 D:\geminirag\Logs 폴더에 날짜별로 저장됩니다. 프로그램 하단의 Input / Output Log 버튼을 눌러 확인할 수 있습니다.
DB 저장: 인덱싱된 데이터는 D:\geminirag\chroma_db_data 폴더에 영구 저장되므로, 프로그램을 껐다 켜도 데이터가 유지됩니다.


웹뷰: 우측 화면에는 lmarena.ai가 로드됩니다. 만약 화면이 나오지 않는다면 인터넷 연결을 확인하세요.
처음 실행시 창 크기는 1800 x 1000으로 설정되어 있습니다. 마우스로 끌어 줄이거나 전체화면으로 하고 사용하시기 바랍니다. 먄약 너무 커서 불편하면 코드를 수정하여 사용하시면 됩니다.

 

설치나 실행 시 특정 단계에서 에러가 발생하면, 그 메시지를 제미나이 3나 다른 AI 에 내용을 붙여넣어 응답대로 실행하여 해결하면 됩니다.

geminirag3.py
0.07MB