ginipick commited on
Commit
2856a21
·
verified ·
1 Parent(s): 6b1964e

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +98 -0
app.py CHANGED
@@ -749,6 +749,104 @@ with gr.Blocks(css=css) as demo:
749
  label="예제 선택"
750
  )
751
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
752
  gr.Markdown("### [email protected]", elem_id="initial-description")
753
 
754
  if __name__ == "__main__":
 
749
  label="예제 선택"
750
  )
751
 
752
+ with gr.Tab("📚 사용 방법"):
753
+ gr.Markdown("""
754
+ # MyEzRAG 사용 가이드
755
+
756
+ ## 1️⃣ My 데이터셋+LLM 탭
757
+ ![Tab1](https://your-image-url.com/tab1.png)
758
+ ### 기능
759
+ - 업로드된 Parquet 데이터셋을 기반으로 LLM과 대화
760
+ - 데이터셋의 내용을 활용한 콘텐츠 생성
761
+
762
+ ### 사용 방법
763
+ 1. Parquet 파일 업로드 섹션에서 데이터셋 파일을 업로드
764
+ 2. 채팅창에 원하는 질문이나 요청사항 입력
765
+ 3. 예제 버튼을 활용하여 다양한 활용 사례 체험
766
+
767
+ ### 팁
768
+ - 시스템 프롬프트 설정으로 응답 스타일 조정 가능
769
+ - 상세한 질문일수록 더 정확한 답변 제공
770
+
771
+ ---
772
+
773
+ ## 2️⃣ CSV to My 데이터셋 탭
774
+ ![Tab2](https://your-image-url.com/tab2.png)
775
+ ### 기능
776
+ - CSV 파일을 Parquet 형식으로 변환
777
+ - 데이터 최적화 및 정제
778
+
779
+ ### 사용 방법
780
+ 1. CSV 파일 준비 (필수 컬럼: id, text, label, metadata)
781
+ 2. 파일 업로드 후 '업로드 및 변환' 버튼 클릭
782
+ 3. 변환된 Parquet 파일 다운로드
783
+
784
+ ### 주의사항
785
+ - CSV 파일은 반드시 필수 컬럼을 포함해야 함
786
+ - 인코딩은 UTF-8 권장
787
+
788
+ ---
789
+
790
+ ## 3️⃣ Text to My 데이터셋 탭
791
+ ![Tab3](https://your-image-url.com/tab3.png)
792
+ ### 기능
793
+ - 텍스트 형식의 데이터를 Parquet으로 변환
794
+ - 수동 데이터 입력 지원
795
+
796
+ ### 사용 방법
797
+ 1. 지정된 형식으로 텍스트 입력
798
+ ```
799
+ 1,"이순신","장군","거북선"
800
+ 2,"원균","장군","모함"
801
+ ```
802
+ 2. '변환 및 다운로드' 버튼 클릭
803
+ 3. 변환된 파일 확인 및 다운로드
804
+
805
+ ### 입력 형식
806
+ - id: 순차적 번호
807
+ - text: 실제 텍스트 내용
808
+ - label: 분류 라벨
809
+ - metadata: 부가 정보
810
+
811
+ ---
812
+
813
+ ## 4️⃣ Text Preprocessing with LLM 탭
814
+ ![Tab4](https://your-image-url.com/tab4.png)
815
+ ### 기능
816
+ - LLM을 활용한 자동 텍스트 전처리
817
+ - 구조화된 데이터셋 생성
818
+
819
+ ### 사용 방법
820
+ 1. 원문 텍스트 입력
821
+ 2. '전처리 실행' 버튼 클릭
822
+ 3. 결과 확인 후 필요시 Parquet 변환
823
+
824
+ ### 특징
825
+ - 자동 레이블링
826
+ - 문장 단위 분리
827
+ - 중복 제거
828
+ - 데이터 정규화
829
+
830
+ ## 💡 일반적인 팁
831
+ - 각 탭의 예제를 참고하여 사용법 익히기
832
+ - 데이터 품질이 좋을수록 더 나은 결과 제공
833
+ - 오류 발생 시 입력 데이터 형식 확인
834
+ - 대용량 처리 시 적절한 청크 크기로 분할 처리
835
+
836
+ ## ⚠️ 주의사항
837
+ - 민감한 개인정보 포함하지 않기
838
+ - 데이터 백업 권장
839
+ - 네트워크 상태 확인
840
+ - 브라우저 캐시 주기적 정리
841
+
842
+ ## 🔍 문제 해결
843
+ - 오류 발생 시 입력 데이터 형식 확인
844
+ - 파일 업로드 실패 시 파일 크기 및 형식 확인
845
+ - 변환 실패 시 데이터 인코딩 확인
846
+ - 응답이 느릴 경우 데이터 크기 조정
847
+ """)
848
+
849
+
850
  gr.Markdown("### [email protected]", elem_id="initial-description")
851
 
852
  if __name__ == "__main__":