Spaces:

danicafisher
/

implications-of-AI

Sleeping

App Files Files Community

danicafisher commited on Sep 19

Commit

2edf59a

•

1 Parent(s): 88077c1

Updates for openai

Browse files

Files changed (2) hide show

app.py +6 -13
requirements.txt +2 -1

app.py CHANGED Viewed

@@ -7,21 +7,16 @@ from aimakerspace.openai_utils.prompts import (
 )
 # from aimakerspace.openai_utils.embedding import EmbeddingModel
 from aimakerspace.vectordatabase import VectorDatabase
-from aimakerspace.openai_utils.chatmodel import ChatOpenAI
 import chainlit as cl
 # import asyncio
 import nest_asyncio
 nest_asyncio.apply()
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
-from langchain_community.embeddings import OpenAIEmbeddings
-# pdf_loader_NIST = PDFFileLoader("data/NIST.AI.600-1.pdf")
-# pdf_loader_Blueprint = PDFFileLoader("data/Blueprint-for-an-AI-Bill-of-Rights.pdf")
-# documents_NIST = pdf_loader_NIST.load_documents()
-# documents_Blueprint = pdf_loader_Blueprint.load_documents()
 filepath_NIST = "data/NIST.AI.600-1.pdf"
 filepath_Blueprint = "data/Blueprint-for-an-AI-Bill-of-Rights.pdf"
@@ -30,10 +25,6 @@ documents_Blueprint = PyMuPDFLoader(filepath_Blueprint).load()
 documents = documents_NIST + documents_Blueprint
-# text_splitter = CharacterTextSplitter()
-# split_documents_NIST = text_splitter.split_texts(documents_NIST)
-# split_documents_Blueprint = text_splitter.split_texts(documents_Blueprint)
 text_splitter = RecursiveCharacterTextSplitter(
     chunk_size = 500,
     chunk_overlap = 50
@@ -101,12 +92,14 @@ async def start_chat():
     # vector_db = await vector_db.abuild_from_list(split_documents_NIST)
     # vector_db = await vector_db.abuild_from_list(split_documents_Blueprint)
-    chat_openai = ChatOpenAI()
     # Create a chain
     retrieval_augmented_qa_pipeline = RetrievalAugmentedQAPipeline(
         vector_db_retriever=vector_db,
-        llm=chat_openai
     )
     # cl.user_session.set("settings", settings)

 )
 # from aimakerspace.openai_utils.embedding import EmbeddingModel
 from aimakerspace.vectordatabase import VectorDatabase
+# from aimakerspace.openai_utils.chatmodel import ChatOpenAI
 import chainlit as cl
 # import asyncio
 import nest_asyncio
 nest_asyncio.apply()
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
+from langchain_openai import ChatOpenAI, OpenAIEmbeddings
 filepath_NIST = "data/NIST.AI.600-1.pdf"
 filepath_Blueprint = "data/Blueprint-for-an-AI-Bill-of-Rights.pdf"
 documents = documents_NIST + documents_Blueprint
 text_splitter = RecursiveCharacterTextSplitter(
     chunk_size = 500,
     chunk_overlap = 50
     # vector_db = await vector_db.abuild_from_list(split_documents_NIST)
     # vector_db = await vector_db.abuild_from_list(split_documents_Blueprint)
+    # chat_openai = ChatOpenAI()
+    llm = ChatOpenAI(model="gpt-4o-mini", tags=["base_llm"])
     # Create a chain
     retrieval_augmented_qa_pipeline = RetrievalAugmentedQAPipeline(
         vector_db_retriever=vector_db,
+        llm=llm
     )
     # cl.user_session.set("settings", settings)

requirements.txt CHANGED Viewed

@@ -5,4 +5,5 @@ PyPDF2
 pymupdf
 langchain
 langchain-community
-langchain-text-splitters

 pymupdf
 langchain
 langchain-community
+langchain-text-splitters
+langchain-openai