ווי צו דערקענען פּדף טעקע אָנליין

Anonim

ווי צו דערקענען פּדף טעקע אָנליין

איר קען נישט שטענדיק באַזייַטיקן דעם טעקסט פון די פּדף טעקע מיט די געוויינטלעך קאָפּיע. אָפט, די בלעטער פון אַזאַ דאָקומענטן זענען די סקאַנד אינהאַלט פון זייער פּאַפּיר אָפּציעס. צו גער אַזאַ טעקעס צו גאָר עדיטאַבלע טעקסט דאַטן, ספּעציעל מגילה זענען געניצט מיט די אָפּטיש כאַראַקטער דערקענונג (OCR) פונקציע.

אַזאַ דיסיזשאַנז זענען זייער קאָמפּלעקס אין פארקויפונג און, דעריבער, עס זענען היפּש געלט. אויב די נויט פֿאַר טעקסט דערקענונג מיט פּדף איר אויפשטיין קעסיידער, עס וועט זיין גאַנץ קעדייַיק צו קויפן די צונעמען פּראָגראַם. פֿאַר זעלטן פאלן, איינער פון די בנימצא אָנליין סערוויסעס מיט ענלעך פֿעיִקייטן וועט זיין מער לאַדזשיקאַל.

ווי צו דערקענען טעקסט מיט פּדף אָנליין

דאָך, אַ סכום פון אָקר אָנליין סערוויסעס, קאַמפּערד מיט פול-פלעדזשד דעסקטאַפּ סאַלושאַנז, איז מער לימיטעד. אָבער עס איז מעגלעך צו אַרבעטן מיט אַזאַ ריסאָרסיז אָדער גאָר פריי אָדער פֿאַר אַ סימבאָליש אָפּצאָל. די הויפּט זאַך איז אַז מיט זייַן הויפּט אַרבעט, ניימלי, מיט די דערקענונג פון די טעקסט, די קאָראַספּאַנדינג וועב אַפּלאַקיישאַנז וועט אויך זיין ווי געזונט.

אופֿן 1: ABBYY FIREEDER אָנליין

די סערוויס דעוועלאָפּער פירמע איז איינער פון די פירער אין די פעלד פון אָפּטיש דערקענונג פון דאָקומענטן. Abby fereader פֿאַר ווינדאָוז און מעק איז אַ שטאַרק לייזונג פֿאַר קאַנווערטינג פּדף צו טעקסט און ווייַטער אַרבעט מיט אים.

די וועב אַנאַלאָג פון דעם פּראָגראַם, פון קורס, איז ערגער ווי עס דורך פאַנגקשאַנאַליטי. דאך, די סערוויס קענען דערקענען די טעקסט פון סקאַנז און פאָוטאַגראַפס אין מער ווי 190 שפּראַכן. שטיצט פּדף טעקע קאַנווערזשאַן צו וואָרט, עקססעל דאָקומענטן, עטק.

אָנליין סערוויס אַבי פינאַסטער אָנליין

  1. איידער איר אָנהייבן ארבעטן מיט אַ געצייַג, שאַפֿן אַ חשבון אויף דעם פּלאַץ אָדער קלאָץ אין מיט די Facebook, Google אָדער Microsoft חשבון.

    רעגיסטראַציע אין די אָנליין סערוויס אַבבי פינעעאַדער אָנליין

    דריקט דעם "לאָגין" קנעפּל אין די שפּיץ מעניו טאַפליע צו גיין צו די דערלויבעניש פֿענצטער אין די שפּיץ מעניו טאַפליע.

  2. דורך לאָגינג אין, אַרייַנפיר די געבעטן פּדף דאָקומענט אין Freereader, ניצן די "אראפקאפיע טעקעס" קנעפּל.

    טעקסט דערקענונג פון די פּדף דאָקומענט אין די אָנליין דינסט אַבי ענדיי פירעעאַדער אָנליין

    דערנאָך גיט "סעלעקט בלאַט נומערן" און ספּעציפיצירן די געבעטן ריס צו דערקענען טעקסט.

  3. דערנאָך, אויסקלייַבן די שפראַכן פאָרשטעלן אין דעם דאָקומענט, די אַוטקאַם טעקע פֿאָרמאַט און גיט די "דערקענען" קנעפּל.

    אָנהייב פון טעקסט דערקענונג פון פּדף דאָקומענט אין אַבבי פיינער אָנליין

  4. נאָך פּראַסעסינג, די געדויער פון וואָס דעפּענדס לעגאַמרע אויף די סומע פון ​​דאָקומענט, איר קענען אראפקאפיע אַ פאַרטיק טעקע מיט טעקסט דאַטן דורך אַ קליק אויף אַ קליק אויף דעם נאָמען.

    דאַונלאָודינג אַ פאַרטיק דאָקומענט פון די אָנליין סערוויס אַבבי פירעאַדער אָנליין

    אָדער אַרויספירן עס צו איינער פון די פאַראַנען קלאָוד באַדינונגס.

די דינסט איז מיסטאָמע די מערסט פּינטלעך טעקסט דערקענונג אַלגערידאַמז אויף בילדער און פּדף טעקעס. אָבער, ליידער, זיין פריי נוצן איז לימיטעד צו פינף פּראַסעסט בלעטער פּער חודש. צו אַרבעטן מיט מער וואַלומינאָוס דאָקומענטן, איר וועט האָבן צו קויפן אַ יערלעך אַבאָנעמענט.

אָבער, אויב די אָקר פונקציע איז דארף גאַנץ ראַרעלי, אַבבי פירעאַדער אָנליין איז אַ ויסגעצייכנט אָפּציע צו עקסטראַקט טעקסט פון קליין פּדף טעקעס.

אופֿן 2: פריי אָנליין אָקר

פּשוט און באַקוועם טעקסט דיגיטאַלייזינג טעקסט. אָן די נויט צו פאַרשרייַבן, די מיטל אַלאַוז איר צו דערקענען 15 גאַנץ פּדף בלעטער פּער שעה. Free אָנליין OCR גאָר אַרבעט מיט דאָקומענטן אין 46 שפּראַכן און אָן דערלויבעניש שטיצט דריי טעקסט עקספּאָרץ - דאָקקס, קסלסקס און טקסט.

ווען איר רעדזשיסטערינג, דער באַניצער באַקומען די געלעגנהייט צו פּראָצעס מולטי בלאַט דאָקומענטן, אָבער, די פריי נומער פון די בלעטער איז לימיטעד צו 50 וניץ.

אָנליין דינסט שפּיל אָנליין אָקר

  1. צו דערקענען טעקסט פון פּדף ווי אַ "גאַסט", אָן דערלויבעניש אויף די ריסאָרס, נוצן די צונעמען פאָרעם אויף די הויפּט בלאַט פון דעם פּלאַץ.

    פּדף דערקענונג אין אָנליין פריי אָנליין אָקר

    סעלעקטירן דעם געוואלט דאָקומענט ניצן די טעקע קנעפּל, ספּעציפיצירן די הויפּט שפּראַך פון די טעקסט, רעזולטאַט פֿאָרמאַט, און וואַרטן פֿאַר די טעקע צו אָפּלאָדירן און גיט גער.

  2. אין די סוף פון די דיגיטיזיישאַן פּראָצעס, גיט "אראפקאפיע רעזולטאַט טעקע" צו ראַטעווען די פאַרטיק דאָקומענט מיט די טעקסט אויף די קאָמפּיוטער.

    לאָודינג טעקסט דערקענונג רעזולטאַטן מיט פּדף פֿון פריי אָנליין אָקר אָנליין דינסט

פֿאַר די אָטערייזד ניצערס, די סיקוואַנס פון אַקשאַנז איז עפּעס אַנדערש.

  1. ניצן די "רעגיסטרירן" אָדער "לאָגין" קנעפּל אין די שפּיץ מעניו טאַפליע צו, ריספּעקטיוולי, שאַפֿן אַ פריי אָנליין אָקר חשבון אָדער גיין צו עס.

    שאפן אַ חשבון אין אָנליין פריי אָנליין אָקר

  2. נאָך דערלויבעניש אין דער דערקענונג טאַפליע, האלטן די "קטרל" שליסל, סעלעקטירן אַרויף צו צוויי שפּראַכן פון די מקור דאָקומענט פון די פארגעלייגט רשימה.

    דעפֿיניציע פון ​​די שפּראַכן פון די מקור דאָקומענט פֿאַר טעקסט דערקענונג אין פריי אָנליין אָקר

  3. ספּעציפיצירן די עפענונג יקסטראַקשאַן פּאַראַמעטערס פון PDF און גיט די סעלעקט טעקע קנעפּל צו אראפקאפיע דעם דאָקומענט צו די דינסט.

    אָנהייב פון פּדף דאָקומענט דערקענונג אין אָנליין דינסט פריי אָנליין אָקר

    דערנאָך, צו פאָרזעצן מיט דערקענונג, גיט "גער".

  4. אין די סוף פון די פּראַסעסינג פון דעם דאָקומענט, דריקט אויף די לינק פון די פּראָדוקציע טעקע אין די צונעמען זייַל.

    דאַונלאָודינג די פאַרטיק דאָקס טעקע פון ​​די פריי אָנליין אָקר אָנליין דינסט

    דער רעזולטאַט פון דערקענונג וועט גלייך זיין גילטיג אין דיין קאָמפּיוטער ס זכּרון.

אויב נייטיק, אַראָפּנעמען טעקסט פון אַ קליין פּדף דאָקומענט קענען זיין זיכער צו נוצן די נוצן פון די געצייַג דיסקרייבד אויבן. צו אַרבעטן מיט וואַלומאַנאַס טעקעס, איר וועט האָבן צו קויפן נאָך אותיות אין פריי אָנליין אָקר אָדער ריזאָרט צו אן אנדער לייזונג.

אופֿן 3: ​​נייַ קאַלק

גאָר פריי OCR דינסט וואָס אַלאַוז איר צו עקסטראַקט טעקסט פון כּמעט קיין גראַפיק און עלעקטראָניש דאָקומענטן ווי DJVU און PDF. די ריסאָרס טוט נישט אָנטאָן ריסטריקשאַנז אויף די גרייס און נומער פון רעקאַגנייזאַבאַל טעקעס און נומער פון רעקאַגנייזאַבאַל, ריקווייערז אַ ברייט קייט פון שייכות פאַנגקשאַנז.

NewoCor שטיצט 106 שפּראַכן און קענען ריכטיק פּראָצעס אפילו נידעריק-קוואַליטעט סקאַנז פון דאָקומענטן. עס איז מעגלעך צו מאַניואַלי קלייַבן די טעקסט דערקענונג געגנט אויף דער טעקע בלאַט.

אָנליין דינסט ניואָקק

  1. איר קענען אָנהייבן ארבעטן מיט אַ ריסאָרס מיד, אָן די נויט צו דורכפירן עקסטרע אַקשאַנז.

    לאָודינג די פּדף טעקע צו דערקענען אָנליין סערוויס נייַ קאַלק

    רעכט אויף דער הויפּט בלאַט עס איז אַ פאָרעם פֿאַר ימפּאָרטינג אַ דאָקומענט צו די פּלאַץ. צו אָפּלאָדירן די טעקע אין דעם דעקאָר, נוצן די סעלעקט טעקע קנעפּל אין די סעלעקט דיין טעקע אָפּטיילונג. דערנאָך אין דער "דערקענונג שפּראַך (s)" פעלד, ספּעציפיצירן איין אָדער מער מקור דאָקומענט שפראכן, און דעמאָלט גיט "צופֿעליקער + אָקר".

  2. ספּעציפיצירן דיין בילכער דערקענונג סעטטינגס, סעלעקטירן דעם געוואלט בלאַט צו צוריקקריגן דעם טעקסט און גיט אויף די OCR קנעפּל.

    באַשטעטיקן אַרויף און לאָנטשינג טעקסט דערקענונג מיט פּדף אין אָנליין דינסט נעוואָקר

  3. מעגילע אַראָפּ די בלאַט אַ ביסל נידעריקער און געפֿינען די "אראפקאפיע" קנעפּל.

    אראפקאפיע געלערנט אין Newoct טעקסט אויף קאָמפּיוטער

    דריקט אויף עס און אין די פאַל-אַראָפּ רשימה, סעלעקטירן דעם געוואלט פֿאָרמאַט פון דעם דאָקומענט צו אָפּלאָדירן. נאָך דעם, די פאַרטיק טעקע מיט די יקסטראַקטיד טעקסט וועט זיין דאַונלאָודיד צו דיין קאָמפּיוטער.

די געצייַג איז באַקוועם און גאַנץ געזונט דערקענט אַלע אותיות. די פּראַסעסינג פון יעדער בלאַט פון די ימפּאָרטיד פּדף דאָקומענט מוזן זיין לאָנטשט ינדיפּענדאַנטלי און איז געוויזן אין אַ באַזונדער טעקע. איר קענען דאָך גלייך נאָכמאַכן די דערקענונג רעזולטאַטן אין די קליפּבאָרד און פאַרבינדן זיי מיט אנדערע.

דאך, געגעבן די אויבן דיסקרייבד נואַנס, גרויס וואַליומז פון טעקסט מיט אַוטאָקראָו צו עקסטראַקט זייער שווער. מיט די קליין טעקעס, די דינסט קאָפּעס "מיט אַ קלאַפּ."

מעטאָד 4: OCR.Space

א פּשוט און פאַרשטיייק מיטל פֿאַר טעקסט דיגיטאַזיישאַן אַלאַוז איר צו דערקענען פּדף דאָקומענטן און רעזולטאַט די רעזולטאַט אין די טקסט טעקע. קיין לימאַץ אין די נומער פון בלעטער זענען נישט צוגעשטעלט. די בלויז באַגרענעצונג איז די גרייס פון דעם אַרייַנשרייַב דאָקומענט זאָל נישט יקסיד 5 מעגאבייט.

אָנליין דינסט OCR.Space

  1. איר טאָן ניט דאַרפֿן צו רעגיסטרירן צו אַרבעטן מיט די געצייַג.

    אַרייַנפיר פּדף טעקע אין אָנליין OCR.Space דינסט

    נאָר גיט אויף די לינק אויבן און אראפקאפיע די פּדף דאָקומענט צו די פּלאַץ פון די קאָמפּיוטער מיט די "סעלעקטירן טעקע" קנעפּל אָדער פֿון דער נעץ דורך דערמאָנען.

  2. סעלעקטירן דעם שפּראַך פון די שפּראַך פון די ימפּאָרטיד דאָקומענט אין די סעלעקט אָקר שפּראַך פאַל-אַראָפּ רשימה.

    פליסנדיק די פּדף דאָקומענט דערקענונג פּראָצעס אין די אָנליין דינסט Ocr.Space

    דערנאָך לויפן די טעקסט דערקענונג פּראָצעס דורך געבן אַ קליק דעם "אָנהייב OCR!" קנעפּל.

  3. אין די סוף פון די טעקע פּראַסעסינג, זען די רעזולטאַט אין די OCR'EED רעזולטאַט פעלד און גיט "אראפקאפיע" צו אָפּלאָדירן די פאַרטיק טקסט דאָקומענט.

    דאַונלאָודינג די רעזולטאַט פון די פּדף טעקע דערקענונג פון די OCR.Space אָנליין דינסט

אויב איר נאָר דאַרפֿן צו עקסטראַקט טעקסט פון פּדף און אין דער זעלביקער צייט די לעצט פאָרמאַטטטינג עס איז נישט וויכטיק אין אַלע, OCR.Space איז אַ גוט ברירה. דער בלויז, דער דאָקומענט מוזן זיין "איין-גערעדט", זינט דער דערקענונג פון צוויי אָדער מער שפראַכן סיימאַלטייניאַסלי אין די סערוויס איז נישט צוגעשטעלט.

לייענען אויך: FIREEDER קאָמפּלימענט אַנאַלאָגועס

יוואַליוייטינג די אָנליין ינסטראַמאַנץ זענען דערלאנגט אין דעם אַרטיקל זאָל זיין אנגעוויזן אַז די פיינער אָנליין פון אַבבי איז די מערסט פּינטלעך און קוואַלאַטייטיוולי מיט די אָקר פונקציע. אויב איר זענט וויכטיק פֿאַר די מאַקסימום דיפאָרמאַטי פון די טעקסט דערקענונג, עס איז בעסטער צו באַטראַכטן ספּאַסיפיקלי דעם אָפּציע. אָבער זיי וועלן רובֿ באַצאָלן פֿאַר אים.

אויב איר דאַרפֿן דיגיטיזאַטיאָן פון קליין דאָקומענטן און איר זענט גרייט צו ריכטיק ריכטיק סערוויס ערראָרס, עס איז קעדייַיק צו נוצן Newocr, OCR.Space אָדער פריי אָנליין אָקר.

לייענען מער