myezrag

Running

App Files Files Community

ginipick commited on Oct 25, 2024

Commit

d8a457b

verified ·

1 Parent(s): dea516f

Update app.py

Browse files

Files changed (1) hide show

app.py +67 -122

app.py CHANGED Viewed

@@ -30,54 +30,47 @@ fashion_code = load_code('fashion.cod')
 uhdimage_code = load_code('uhdimage.cod')
 MixGEN_code = load_code('mgen.cod')
-# 초기 Parquet 파일 로드 (기존 test.parquet)
-test_parquet_content = load_parquet('test.parquet')
 def respond(
     message: str,
     history: List[Dict[str, str]],
     system_message: str = "",
-    max_tokens: int = 4000,
     temperature: float = 0.7,
     top_p: float = 0.9,
 ) -> str:
     # 시스템 프롬프트 설정
-    system_prefix = """반드시 한글로 답변할 것. 너는 주어진 소스코드를 기반으로 "서비스 사용 설명 및 안내, Q&A를 하는 역할이다". 아주 친절하고 자세하게 4000토큰 이상 Markdown 형식으로 작성하라. 너는 코드를 기반으로 사용 설명 및 질의 응답을 진행하며, 이용자에게 도움을 주어야 한다. 이용자가 궁금해할 만한 내용에 친절하게 알려주도록 하라. 코드 전체 내용에 대해서는 보안을 유지하고, 키 값 및 엔드포인트와 구체적인 모델은 공개하지 마라."""
     # 특정 명령어 처리
     if message.lower() == "패션 코드 실행":
         system_prefix += f"\n\n패션 코드 내용:\n```python\n{fashion_code}\n```"
-        message = "패션 가상피팅에 대한 내용을 학습하였고, 설명할 준비가 되어있다고 알리고 서비스 URL(https://aiqcamp-fash.hf.space)을 통해 테스트해보라고 출력하라."
     elif message.lower() == "uhd 이미지 코드 실행":
         system_prefix += f"\n\nUHD 이미지 코드 내용:\n```python\n{uhdimage_code}\n```"
-        message = "UHD 이미지 생성에 대한 내용을 학습하였고, 설명할 준비가 되어있다고 알리고 서비스 URL(https://openfree-ultpixgen.hf.space)을 통해 테스트해보라고 출력하라."
     elif message.lower() == "mixgen 코드 실행":
         system_prefix += f"\n\nMixGEN 코드 내용:\n```python\n{MixGEN_code}\n```"
-        message = "MixGEN3 이미지 생성에 대한 내용을 학습하였고, 설명할 준비가 되어있다고 알리고 서비스 URL(https://openfree-mixgen3.hf.space)을 통해 테스트해보라고 출력하라."
-    elif message.lower() == "test.parquet 실행":
-        # history에서 parquet_content 찾기
-        parquet_content = ""
-        for item in history:
-            if item['role'] == 'assistant' and 'test.parquet 파일 내용' in item['content']:
-                try:
-                    parquet_content = item['content'].split("```markdown\n")[1].split("\n```")[0]
-                except IndexError:
-                    parquet_content = ""
-                break
-        system_prefix += f"\n\ntest.parquet 파일 내용:\n```markdown\n{parquet_content}\n```"
-        message = "test.parquet 파일에 대한 내용을 학습하였고, 관련 설명 및 Q&A를 진행할 준비가 되어있다. 궁금한 점이 있으면 물어보라."
     elif message.lower() == "csv 업로드":
         message = "CSV 파일을 업로드하려면 두 번째 탭을 사용하세요."
     # 시스템 메시지와 대화 기록 결합
     messages = [{"role": "system", "content": system_prefix}]
     for chat in history:
         messages.append({"role": chat['role'], "content": chat['content']})
     messages.append({"role": "user", "content": message})
-    response = ""
     try:
         # 모델에 메시지 전송 및 응답 받기
         for msg in hf_client.chat_completion(
             messages,
             max_tokens=max_tokens,
@@ -116,14 +109,11 @@ def upload_csv(file_path: str) -> Tuple[str, str]:
         parquet_filename = os.path.splitext(os.path.basename(file_path))[0] + '.parquet'
         df.to_parquet(parquet_filename, engine='pyarrow', compression='snappy')
-        # Parquet 파일 내용 미리보기
-        parquet_content = load_parquet(parquet_filename)
         return f"{parquet_filename} 파일이 성공적으로 업로드되고 변환되었습니다.", parquet_filename
     except Exception as e:
         return f"CSV 파일 업로드 및 변환 중 오류가 발생했습니다: {str(e)}", ""
-def upload_parquet(file_path: str) -> Tuple[str, str, Dict]:
     try:
         # Parquet 파일 읽기
         df = pd.read_parquet(file_path, engine='pyarrow')
@@ -131,9 +121,12 @@ def upload_parquet(file_path: str) -> Tuple[str, str, Dict]:
         # Markdown으로 변환하여 미리보기
         parquet_content = df.head(10).to_markdown(index=False)
-        return "Parquet 파일이 성공적으로 업로드되었습니다.", parquet_content, df.to_json()
     except Exception as e:
-        return f"Parquet 파일 업로드 중 오류가 발생했습니다: {str(e)}", "", {}
 def text_to_parquet(text: str) -> Tuple[str, str, str]:
     try:
@@ -178,12 +171,34 @@ textarea, input[type="text"] {
 with gr.Blocks(css=css) as demo:
     gr.Markdown("# LLM 서비스 인터페이스")
-    # 첫 번째 탭: 챗봇
-    with gr.Tab("챗봇"):
         gr.Markdown("### LLM과 대화하기")
-        chatbot = gr.Chatbot(label="챗봇", type="messages", elem_id="chatbot-container")
-        msg = gr.Textbox(label="메시지 입력", placeholder="여기에 메시지를 입력하세요...", elem_id="input-text")
-        send = gr.Button("전송")
         with gr.Accordion("시스템 프롬프트 및 옵션 설정", open=False):
             system_message = gr.Textbox(label="System Message", value="너는 AI 조언자 역할이다.")
@@ -191,49 +206,33 @@ with gr.Blocks(css=css) as demo:
             temperature = gr.Slider(minimum=0, maximum=1, value=0.7, label="Temperature")
             top_p = gr.Slider(minimum=0, maximum=1, value=0.9, label="Top P")
-        # 챗봇 메시지 처리 함수
-        def handle_message(message, history, system_message, max_tokens, temperature, top_p):
             history = history or []
             try:
                 # 응답 생성
-                response_gen = respond(message, history, system_message, max_tokens, temperature, top_p)
-                response = ""
                 for partial in response_gen:
-                    response = partial  # 최종 응답
-                # 사용자의 메시지와 어시스턴트의 응답을 히스토리에 추가
-                history.append({"role": "user", "content": message})
-                history.append({"role": "assistant", "content": response})
             except Exception as e:
                 response = f"추론 중 오류가 발생했습니다: {str(e)}"
-                history.append({"role": "user", "content": message})
                 history.append({"role": "assistant", "content": response})
-            return history, ""
-        send.click(
-            handle_message,
-            inputs=[msg, chatbot, system_message, max_tokens, temperature, top_p],
-            outputs=[chatbot, msg]
         )
-        # 예제 복원
-        with gr.Accordion("예제", open=False):
-            gr.Examples(
-                examples=[
-                    ["패션 코드 실행"],
-                    ["UHD 이미지 코드 실행"],
-                    ["MixGEN 코드 실행"],
-                    ["test.parquet 실행"],
-                    ["상세한 사용 방법을 마치 화면을 보면서 설명하듯이 4000 토큰 이상 자세히 설명하라"],
-                    ["FAQ 20건을 상세하게 작성하라. 4000토큰 이상 사용하라."],
-                    ["사용 방법과 차별점, 특징, 강점을 중심으로 4000 토큰 이상 유튜브 영상 스크립트 형태로 작성하라"],
-                    ["본 서비스를 SEO 최적화하여 블로그 포스트(배경 및 필요성, 기존 유사 서비스와 비교하여 특장점, 활용처, 가치, 기대효과, 결론을 포함)로 4000 토큰 이상 작성하라"],
-                    ["특허 출원에 활용할 기술 및 비즈니스모델 측면을 포함하여 특허 출원서 구성에 맞게 혁신적인 창의 발명 내용을 중심으로 4000 토큰 이상 작성하라."],
-                    ["계속 이어서 답변하라"],
-                ],
-                inputs=msg,
-                label="예제 선택",
-            )
     # 두 번째 탭: 데이터 변환
     with gr.Tab("데이터 변환"):
         gr.Markdown("### CSV 파일 업로드 및 Parquet 변환")
@@ -258,9 +257,6 @@ with gr.Blocks(css=css) as demo:
                     inputs=csv_file,
                     outputs=[upload_status, parquet_preview, download_button]
                 )
-        gr.Markdown("### 기존 Parquet 파일")
-        gr.Markdown(f"**test.parquet 파일 내용:**\n```markdown\n{test_parquet_content}\n```")
     # 세 번째 탭: 텍스트 to csv to parquet 변환
     with gr.Tab("텍스트 to csv to parquet 변환"):
@@ -290,66 +286,14 @@ with gr.Blocks(css=css) as demo:
                     outputs=[convert_status, parquet_preview_convert, download_parquet_convert]
                 )
-    # 네 번째 탭: 챗봇 데이터 업로드
-    with gr.Tab("챗봇 데이터 업로드"):
-        gr.Markdown("### Parquet 파일 업로드 및 질문하기")
-        with gr.Row():
-            with gr.Column():
-                parquet_upload = gr.File(label="Parquet 파일 업로드", type="filepath")
-                parquet_upload_button = gr.Button("업로드")
-                parquet_upload_status = gr.Textbox(label="업로드 상태", interactive=False)
-                parquet_preview_chat = gr.Markdown(label="Parquet 파일 미리보기")
-                parquet_data_state = gr.State()
-                def handle_parquet_upload(file_path: str):
-                    message, parquet_content, parquet_json = upload_parquet(file_path)
-                    if parquet_json:
-                        return message, parquet_content, parquet_json
-                    else:
-                        return message, "", {}
-                parquet_upload_button.click(
-                    handle_parquet_upload,
-                    inputs=parquet_upload,
-                    outputs=[parquet_upload_status, parquet_preview_chat, parquet_data_state]
-                )
-        gr.Markdown("### LLM과 대화하기")
-        chatbot_data_upload = gr.Chatbot(label="챗봇 데이터 업로드", type="messages", elem_id="chatbot-data-upload")
-        msg_data_upload = gr.Textbox(label="메시지 입력", placeholder="여기에 메시지를 입력하세요...")
-        send_data_upload = gr.Button("전송")
-        def handle_message_data_upload(message: str, history: List[Dict[str, str]], system_message: str, max_tokens: int, temperature: float, top_p: float, parquet_data: Dict):
-            history = history or []
-            try:
-                # Parquet 데이터를 활용할 수 있는 로직 추가 가능
-                response_gen = respond(message, history, system_message, max_tokens, temperature, top_p)
-                response = ""
-                for partial in response_gen:
-                    response = partial
-                # 사용자의 메시지와 어시스턴트의 응답을 히스토리에 추가
-                history.append({"role": "user", "content": message})
-                history.append({"role": "assistant", "content": response})
-            except Exception as e:
-                response = f"추론 중 오류가 발생했습니다: {str(e)}"
-                history.append({"role": "user", "content": message})
-                history.append({"role": "assistant", "content": response})
-            return history, ""
-        send_data_upload.click(
-            handle_message_data_upload,
-            inputs=[msg_data_upload, chatbot_data_upload, system_message, max_tokens, temperature, top_p, parquet_data_state],
-            outputs=[chatbot_data_upload, msg_data_upload]
-        )
     # 주의 사항
     gr.Markdown("## 주의 사항")
     gr.Markdown("""
     - **CSV 업로드**: CSV 파일을 업로드하면 자동으로 Parquet 파일로 변환됩니다. CSV 파일은 반드시 **콤마(`,`)**로 구분되어야 합니다.
     - **Parquet 미리보기**: 업로드된 Parquet 파일의 첫 10개 행이 미리보기로 표시됩니다.
-    - **LLM과의 대화**: 변환된 Parquet 파일 내용을 기반으로 LLM이 응답을 생성합니다.
     - **Parquet 다운로드**: 변환된 Parquet 파일을 다운로드하려면 변환된 파일 옆의 다운로드 링크를 클릭하세요.
-    - **챗봇 데이터 업로드**: 챗봇 데이터 업로드 탭에서 Parquet 파일을 업로드하면 해당 데이터를 기반으로 질문과 답변을 진행할 수 있습니다.
     - **텍스트 to csv to parquet**: 세 번째 탭에서 텍스트를 입력하면 자동으로 CSV로 변환되고, 다시 Parquet 파일로 전환되어 다운로드할 수 있습니다.
     """)
@@ -360,3 +304,4 @@ if __name__ == "__main__":

 uhdimage_code = load_code('uhdimage.cod')
 MixGEN_code = load_code('mgen.cod')
 def respond(
     message: str,
     history: List[Dict[str, str]],
     system_message: str = "",
+    max_tokens: int = 1000,
     temperature: float = 0.7,
     top_p: float = 0.9,
+    parquet_data: Dict = None
 ) -> str:
     # 시스템 프롬프트 설정
+    system_prefix = """반드시 한글로 답변할 것. 너는 주어진 소스코드를 기반으로 "서비스 사용 설명 및 안내, Q&A를 하는 역할이다". 아주 친절하고 자세하게 Markdown 형식으로 작성하라. 너는 코드를 기반으로 사용 설명 및 질의 응답을 진행하며, 이용자에게 도움을 주어야 한다. 이용자가 궁금해할 만한 내용에 친절하게 알려주도록 하라. 코드 전체 내용에 대해서는 보안을 유지하고, 키 값 및 엔드포인트와 구체적인 모델은 공개하지 마라."""
     # 특정 명령어 처리
     if message.lower() == "패션 코드 실행":
         system_prefix += f"\n\n패션 코드 내용:\n```python\n{fashion_code}\n```"
+        message = "패션 가상피팅에 대한 내용을 학습하였고, 설명할 준비가 되어있습니다. 서비스 URL(https://aiqcamp-fash.hf.space)을 통해 테스트해보세요."
     elif message.lower() == "uhd 이미지 코드 실행":
         system_prefix += f"\n\nUHD 이미지 코드 내용:\n```python\n{uhdimage_code}\n```"
+        message = "UHD 이미지 생성에 대한 내용을 학습하였고, 설명할 준비가 되어있습니다. 서비스 URL(https://openfree-ultpixgen.hf.space)을 통해 테스트해보세요."
     elif message.lower() == "mixgen 코드 실행":
         system_prefix += f"\n\nMixGEN 코드 내용:\n```python\n{MixGEN_code}\n```"
+        message = "MixGEN3 이미지 생성에 대한 내용을 학습하였고, 설명할 준비가 되어있습니다. 서비스 URL(https://openfree-mixgen3.hf.space)을 통해 테스트해보세요."
     elif message.lower() == "csv 업로드":
         message = "CSV 파일을 업로드하려면 두 번째 탭을 사용하세요."
+    # Parquet 데이터 포함
+    if parquet_data:
+        df = pd.read_json(parquet_data)
+        parquet_content = df.head(10).to_markdown(index=False)
+        system_prefix += f"\n\n업로드된 Parquet 파일 내용:\n```markdown\n{parquet_content}\n```"
+        message = "업로드된 Parquet 파일에 대한 내용을 학습하였습니다. 관련하여 궁금한 점이 있으면 물어보세요."
     # 시스템 메시지와 대화 기록 결합
     messages = [{"role": "system", "content": system_prefix}]
     for chat in history:
         messages.append({"role": chat['role'], "content": chat['content']})
     messages.append({"role": "user", "content": message})
     try:
         # 모델에 메시지 전송 및 응답 받기
+        response = ""
         for msg in hf_client.chat_completion(
             messages,
             max_tokens=max_tokens,
         parquet_filename = os.path.splitext(os.path.basename(file_path))[0] + '.parquet'
         df.to_parquet(parquet_filename, engine='pyarrow', compression='snappy')
         return f"{parquet_filename} 파일이 성공적으로 업로드되고 변환되었습니다.", parquet_filename
     except Exception as e:
         return f"CSV 파일 업로드 및 변환 중 오류가 발생했습니다: {str(e)}", ""
+def upload_parquet(file_path: str) -> Tuple[str, str, str]:
     try:
         # Parquet 파일 읽기
         df = pd.read_parquet(file_path, engine='pyarrow')
         # Markdown으로 변환하여 미리보기
         parquet_content = df.head(10).to_markdown(index=False)
+        # DataFrame을 JSON으로 변환
+        parquet_json = df.to_json()
+        return "Parquet 파일이 성공적으로 업로드되었습니다.", parquet_content, parquet_json
     except Exception as e:
+        return f"Parquet 파일 업로드 중 오류가 발생했습니다: {str(e)}", "", ""
 def text_to_parquet(text: str) -> Tuple[str, str, str]:
     try:
 with gr.Blocks(css=css) as demo:
     gr.Markdown("# LLM 서비스 인터페이스")
+    # 첫 번째 탭: 챗봇 데이터 업로드 (이전 네 번째 탭)
+    with gr.Tab("챗봇 데이터 업로드"):
+        gr.Markdown("### Parquet 파일 업로드 및 질문하기")
+        with gr.Row():
+            with gr.Column():
+                parquet_upload = gr.File(label="Parquet 파일 업로드", type="filepath")
+                parquet_upload_button = gr.Button("업로드")
+                parquet_upload_status = gr.Textbox(label="업로드 상태", interactive=False)
+                parquet_preview_chat = gr.Markdown(label="Parquet 파일 미리보기")
+                parquet_data_state = gr.State()
+                def handle_parquet_upload(file_path: str):
+                    message, parquet_content, parquet_json = upload_parquet(file_path)
+                    if parquet_json:
+                        return message, parquet_content, parquet_json
+                    else:
+                        return message, "", ""
+                parquet_upload_button.click(
+                    handle_parquet_upload,
+                    inputs=parquet_upload,
+                    outputs=[parquet_upload_status, parquet_preview_chat, parquet_data_state]
+                )
         gr.Markdown("### LLM과 대화하기")
+        chatbot_data_upload = gr.Chatbot(label="챗봇", type="messages", elem_id="chatbot-data-upload")
+        msg_data_upload = gr.Textbox(label="메시지 입력", placeholder="여기에 메시지를 입력하세요...")
+        send_data_upload = gr.Button("전송")
         with gr.Accordion("시스템 프롬프트 및 옵션 설정", open=False):
             system_message = gr.Textbox(label="System Message", value="너는 AI 조언자 역할이다.")
             temperature = gr.Slider(minimum=0, maximum=1, value=0.7, label="Temperature")
             top_p = gr.Slider(minimum=0, maximum=1, value=0.9, label="Top P")
+        def handle_message_data_upload(message: str, history: List[Dict[str, str]], system_message: str, max_tokens: int, temperature: float, top_p: float, parquet_data: str):
             history = history or []
+            history.append({"role": "user", "content": message})
             try:
                 # 응답 생성
+                response_gen = respond(message, history, system_message, max_tokens, temperature, top_p, parquet_data)
+                partial_response = ""
                 for partial in response_gen:
+                    partial_response = partial
+                    # 어시스턴트의 마지막 메시지를 업데이트하여 스트리밍 효과 제공
+                    if len(history) > 0 and history[-1]['role'] == 'assistant':
+                        history[-1]['content'] = partial_response
+                    else:
+                        history.append({"role": "assistant", "content": partial_response})
+                    yield history, ""
             except Exception as e:
                 response = f"추론 중 오류가 발생했습니다: {str(e)}"
                 history.append({"role": "assistant", "content": response})
+                yield history, ""
+        send_data_upload.click(
+            handle_message_data_upload,
+            inputs=[msg_data_upload, chatbot_data_upload, system_message, max_tokens, temperature, top_p, parquet_data_state],
+            outputs=[chatbot_data_upload, msg_data_upload],
+            queue=True
         )
     # 두 번째 탭: 데이터 변환
     with gr.Tab("데이터 변환"):
         gr.Markdown("### CSV 파일 업로드 및 Parquet 변환")
                     inputs=csv_file,
                     outputs=[upload_status, parquet_preview, download_button]
                 )
     # 세 번째 탭: 텍스트 to csv to parquet 변환
     with gr.Tab("텍스트 to csv to parquet 변환"):
                     outputs=[convert_status, parquet_preview_convert, download_parquet_convert]
                 )
     # 주의 사항
     gr.Markdown("## 주의 사항")
     gr.Markdown("""
     - **CSV 업로드**: CSV 파일을 업로드하면 자동으로 Parquet 파일로 변환됩니다. CSV 파일은 반드시 **콤마(`,`)**로 구분되어야 합니다.
     - **Parquet 미리보기**: 업로드된 Parquet 파일의 첫 10개 행이 미리보기로 표시됩니다.
+    - **LLM과의 대화**: 업로드된 Parquet 파일 내용을 기반으로 LLM이 응답을 생성합니다.
     - **Parquet 다운로드**: 변환된 Parquet 파일을 다운로드하려면 변환된 파일 옆의 다운로드 링크를 클릭하세요.
+    - **챗봇 데이터 업로드**: 첫 번째 탭에서 Parquet 파일을 업로드하면 해당 데이터를 기반으로 질문과 답변을 진행할 수 있습니다.
     - **텍스트 to csv to parquet**: 세 번째 탭에서 텍스트를 입력하면 자동으로 CSV로 변환되고, 다시 Parquet 파일로 전환되어 다운로드할 수 있습니다.
     """)