Update app.py
Browse files
app.py
CHANGED
@@ -749,6 +749,104 @@ with gr.Blocks(css=css) as demo:
|
|
749 |
label="예제 선택"
|
750 |
)
|
751 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
752 |
gr.Markdown("### [email protected]", elem_id="initial-description")
|
753 |
|
754 |
if __name__ == "__main__":
|
|
|
749 |
label="예제 선택"
|
750 |
)
|
751 |
|
752 |
+
with gr.Tab("📚 사용 방법"):
|
753 |
+
gr.Markdown("""
|
754 |
+
# MyEzRAG 사용 가이드
|
755 |
+
|
756 |
+
## 1️⃣ My 데이터셋+LLM 탭
|
757 |
+
![Tab1](https://your-image-url.com/tab1.png)
|
758 |
+
### 기능
|
759 |
+
- 업로드된 Parquet 데이터셋을 기반으로 LLM과 대화
|
760 |
+
- 데이터셋의 내용을 활용한 콘텐츠 생성
|
761 |
+
|
762 |
+
### 사용 방법
|
763 |
+
1. Parquet 파일 업로드 섹션에서 데이터셋 파일을 업로드
|
764 |
+
2. 채팅창에 원하는 질문이나 요청사항 입력
|
765 |
+
3. 예제 버튼을 활용하여 다양한 활용 사례 체험
|
766 |
+
|
767 |
+
### 팁
|
768 |
+
- 시스템 프롬프트 설정으로 응답 스타일 조정 가능
|
769 |
+
- 상세한 질문일수록 더 정확한 답변 제공
|
770 |
+
|
771 |
+
---
|
772 |
+
|
773 |
+
## 2️⃣ CSV to My 데이터셋 탭
|
774 |
+
![Tab2](https://your-image-url.com/tab2.png)
|
775 |
+
### 기능
|
776 |
+
- CSV 파일을 Parquet 형식으로 변환
|
777 |
+
- 데이터 최적화 및 정제
|
778 |
+
|
779 |
+
### 사용 방법
|
780 |
+
1. CSV 파일 준비 (필수 컬럼: id, text, label, metadata)
|
781 |
+
2. 파일 업로드 후 '업로드 및 변환' 버튼 클릭
|
782 |
+
3. 변환된 Parquet 파일 다운로드
|
783 |
+
|
784 |
+
### 주의사항
|
785 |
+
- CSV 파일은 반드시 필수 컬럼을 포함해야 함
|
786 |
+
- 인코딩은 UTF-8 권장
|
787 |
+
|
788 |
+
---
|
789 |
+
|
790 |
+
## 3️⃣ Text to My 데이터셋 탭
|
791 |
+
![Tab3](https://your-image-url.com/tab3.png)
|
792 |
+
### 기능
|
793 |
+
- 텍스트 형식의 데이터를 Parquet으로 변환
|
794 |
+
- 수동 데이터 입력 지원
|
795 |
+
|
796 |
+
### 사용 방법
|
797 |
+
1. 지정된 형식으로 텍스트 입력
|
798 |
+
```
|
799 |
+
1,"이순신","장군","거북선"
|
800 |
+
2,"원균","장군","모함"
|
801 |
+
```
|
802 |
+
2. '변환 및 다운로드' 버튼 클릭
|
803 |
+
3. 변환된 파일 확인 및 다운로드
|
804 |
+
|
805 |
+
### 입력 형식
|
806 |
+
- id: 순차적 번호
|
807 |
+
- text: 실제 텍스트 내용
|
808 |
+
- label: 분류 라벨
|
809 |
+
- metadata: 부가 정보
|
810 |
+
|
811 |
+
---
|
812 |
+
|
813 |
+
## 4️⃣ Text Preprocessing with LLM 탭
|
814 |
+
![Tab4](https://your-image-url.com/tab4.png)
|
815 |
+
### 기능
|
816 |
+
- LLM을 활용한 자동 텍스트 전처리
|
817 |
+
- 구조화된 데이터셋 생성
|
818 |
+
|
819 |
+
### 사용 방법
|
820 |
+
1. 원문 텍스트 입력
|
821 |
+
2. '전처리 실행' 버튼 클릭
|
822 |
+
3. 결과 확인 후 필요시 Parquet 변환
|
823 |
+
|
824 |
+
### 특징
|
825 |
+
- 자동 레이블링
|
826 |
+
- 문장 단위 분리
|
827 |
+
- 중복 제거
|
828 |
+
- 데이터 정규화
|
829 |
+
|
830 |
+
## 💡 일반적인 팁
|
831 |
+
- 각 탭의 예제를 참고하여 사용법 익히기
|
832 |
+
- 데이터 품질이 좋을수록 더 나은 결과 제공
|
833 |
+
- 오류 발생 시 입력 데이터 형식 확인
|
834 |
+
- 대용량 처리 시 적절한 청크 크기로 분할 처리
|
835 |
+
|
836 |
+
## ⚠️ 주의사항
|
837 |
+
- 민감한 개인정보 포함하지 않기
|
838 |
+
- 데이터 백업 권장
|
839 |
+
- 네트워크 상태 확인
|
840 |
+
- 브라우저 캐시 주기적 정리
|
841 |
+
|
842 |
+
## 🔍 문제 해결
|
843 |
+
- 오류 발생 시 입력 데이터 형식 확인
|
844 |
+
- 파일 업로드 실패 시 파일 크기 및 형식 확인
|
845 |
+
- 변환 실패 시 데이터 인코딩 확인
|
846 |
+
- 응답이 느릴 경우 데이터 크기 조정
|
847 |
+
""")
|
848 |
+
|
849 |
+
|
850 |
gr.Markdown("### [email protected]", elem_id="initial-description")
|
851 |
|
852 |
if __name__ == "__main__":
|