{ "cells": [ { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "from ArabicOcr import arabicocr\n" ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "Using CPU. Note: This module is much faster with a GPU.\n" ] }, { "name": "stdout", "output_type": "stream", "text": [ "[INFO] OCR'ing input image...\n", "[INFO] 0.4919: بدأ فيأ حلم عرب ختم فيأ مهرج بحر حلم\n", "[INFO] 0.2563: لدعط\n", "[INFO] 0.8595: بكر يواصل سيناريو\n", "[INFO] 0.6365: عبدالرحمن دخيل تماماًكون متوقعاً ضبط\n", "[INFO] 0.4543: أتي مهرج بحر دول للأغنية صور هزيلاً\n", "[INFO] 0.6843: فاشلا فيأكلأ شيء نظم سيىء جمل\n", "[INFO] 0.6381: جمل حدث دراماتيكية يسعني الاان اقف\n", "[INFO] 0.9383: سيناريو تراجيدي\n", "[INFO] 0.3568: منتسماً\n", "[INFO] 0.2621: ددوا\n", "[INFO] 0.7647: عمل فيأ\n", "[INFO] 0.5875: فصل منامة . كلأ هتم\n", "[INFO] 0.9771: كتب\n", "[INFO] 0.9535: للفنانين\n", "[INFO] 0.7544: أسي\n", "[INFO] 0.9973: حدث\n", "[INFO] 0.9826: فني\n", "{'Extracted': ['بدأ فيأ حلم عرب ختم فيأ مهرج بحر حلم', 'لدعط', 'بكر يواصل سيناريو', 'عبدالرحمن دخيل تماماًكون متوقعاً ضبط', 'أتي مهرج بحر دول للأغنية صور هزيلاً', 'فاشلا فيأكلأ شيء نظم سيىء جمل', 'جمل حدث دراماتيكية يسعني الاان اقف', 'سيناريو تراجيدي', 'منتسماً', 'ددوا', 'عمل فيأ', 'فصل منامة . كلأ هتم', 'كتب', 'للفنانين', 'أسي', 'حدث', 'فني']}\n" ] } ], "source": [ "image_path='img/a.png'\n", "out_image='out/out.jpg'\n", "results=arabicocr.arabic_ocr(image_path,out_image)\n", "# print(results)\n", "words=[]\n", "for i in range(len(results)):\t\n", "\t\tword=results[i][1]\n", "\t\t# print(word)\n", "\t\twords.append(word)\n", "data = {\"Extracted\":words}\n", "print(data)\n", "# with open ('file.txt','w',encoding='utf-8')as myfile:\n", "# \t\tmyfile.write(str(words))\n", "# import cv2\n", "# img = cv2.imread('out/out.jpg', cv2.IMREAD_UNCHANGED)\n", "# cv2.imshow(\"arabic ocr\",img)\n", "# cv2.waitKey(0)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "arabic", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.12.2" } }, "nbformat": 4, "nbformat_minor": 2 }