Spaces:

taishi-i
/

awesome-japanese-nlp-resources-search

Running

App Files Files Community

taishi-i commited on Jun 8, 2024

Commit

1864742

1 Parent(s): be23b05

update app.py

Browse files

Files changed (2) hide show

README.md +2 -2
app.py +31 -95

README.md CHANGED Viewed

@@ -3,8 +3,8 @@ title: Awesome Japanese Nlp Resources Search
 emoji: 🏢
 colorFrom: gray
 colorTo: indigo
-sdk: streamlit
-sdk_version: 1.17.0
 app_file: app.py
 pinned: false
 license: mit

 emoji: 🏢
 colorFrom: gray
 colorTo: indigo
+sdk: gradio
+sdk_version: 4.36.0
 app_file: app.py
 pinned: false
 license: mit

app.py CHANGED Viewed

@@ -1,110 +1,46 @@
 import json
-import streamlit as st
 from pyserini.search.lucene import LuceneSearcher
-class SearchApplication:
-    def __init__(self):
-        self.title = "Awesome Japanese NLP resources search"
-        self.set_page_config()
-        self.searcher = self.set_searcher()
-        st.header(self.title)
-        col1, col2 = st.columns(2)
-        with col1:
-            self.query = st.text_input(
-                "Search English or Japanese words", value=""
-            )
-        with col2:
-            st.write("#")
-            self.search_button = st.button("🔎")
-        st.caption(
-            "You can search for open-source software from [500+ Japanese NLP"
-            " repositories](https://github.com/taishi-i/awesome-japanese-nlp-resources)."
-        )
-        st.write("#")
-        self.show_popular_words()
-        self.show_search_results()
-    def set_page_config(self):
-        st.set_page_config(
-            page_title=self.title,
-            page_icon="😎",
-            layout="centered",
-        )
-    def set_searcher(self):
-        searcher = LuceneSearcher("indexes/docs")
-        searcher.set_language("ja")
-        return searcher
-    def show_popular_words(self):
-        st.caption("Popular words")
-        word1, word2, word3, word4, _ = st.columns(5)
-        with word1:
-            button1 = st.button("Python")
-            if button1:
-                self.query = "Python"
-        with word2:
-            button2 = st.button("ChatGPT")
-            if button2:
-                self.query = "ChatGPT"
-        with word3:
-            button3 = st.button("辞書")
-            if button3:
-                self.query = "辞書"
-        with word4:
-            button4 = st.button("コーパス")
-            if button4:
-                self.query = "Corpus"
-    def show_search_results(self):
-        if self.query or self.search_button:
-            st.write("#")
-            search_results = self.searcher.search(self.query, k=500)
-            num_search_results = len(search_results)
-            st.write(f"{num_search_results} results")
-            for result in sorted(
-                search_results,
-                key=lambda x: json.loads(self.searcher.doc(x.docid).raw())[
-                    "stargazers_count"
-                ],
-                reverse=True,
-            ):
-                docid = result.docid
-                doc = self.searcher.doc(docid)
-                data_json = json.loads(doc.raw())
-                description = data_json["description"]
-                url = data_json["url"]
-                project_name = data_json["project_name"]
-                main_topic = data_json["main_topic"]
-                sub_topic = data_json["sub_topic"]
-                st.write("---")
-                st.subheader(f"[{project_name}]({url})")
-                st.markdown(description)
-                if sub_topic is None:
-                    st.caption(f"{main_topic}")
-                else:
-                    st.caption(f"{main_topic} / {sub_topic}")
-                st.write("#")
-def main():
-    SearchApplication()
-if __name__ == "__main__":
-    main()

 import json
+import gradio as gr
+import pandas as pd
 from pyserini.search.lucene import LuceneSearcher
+searcher = LuceneSearcher("indexes/docs")
+searcher.set_language("ja")
+def show_search_results(query):
+    search_results = searcher.search(query, k=100)
+    data = {"project_name": [], "description": []}
+    for result in search_results:
+        docid = result.docid
+        doc = searcher.doc(docid)
+        data_json = json.loads(doc.raw())
+        url = data_json["url"]
+        description = data_json["description"]
+        project_name = data_json["project_name"]
+        data["project_name"].append(f"[{project_name}]({url})")
+        data["description"].append(description)
+    data = pd.DataFrame(data)
+    return data
+with gr.Blocks() as demo:
+    gr.Markdown(
+        """
+    # Awesome Japanese NLP resources search 🔎
+    You can search for open-source software from [500+ Japanese NLP repositories](https://github.com/taishi-i/awesome-japanese-nlp-resources).
+    """
+    )
+    query = gr.Textbox(
+        label="Search English or Japanese words", placeholder="llm"
+    )
+    df = gr.DataFrame(type="pandas", datatype="markdown", height=1000)
+    query.change(fn=show_search_results, inputs=query, outputs=df)
+demo.launch()