كيفية تحويل PDF إلى نص عادي
يتم عادةً تحويل PDF إلى نص عادي عندما تريد تحرير المحتوى في محرر نصي مثل Notepad أو Apple Notes. يمكنك القيام بذلك بحيث يتم إزالة التنسيق ويكون المحتوى مجرد نص بسيط. هذا النص البسيط ، المعروف أيضًا باسم النص العادي ، هو نوع من تنسيق الملفات خفيف الوزن الذي لا يسمح بعناصر النمط مثل أنواع الخطوط والألوان وما إلى ذلك. ستعرض هذه المقالة ثلاث طرق حول كيفية تحويل PDF إلى مستندات نصية عادية.
الأداة # 1 - كيفية تحويل PDF إلى نص عادي باستخدام PDFelement
PDFelement هو أداة شاملة لإدارة ملفات PDF مع ميزات تحويل قوية وسريعة ودقيقة. يمكنك اختيار HTML كملف الإخراج ، بالإضافة إلى ملفات Office والعديد من التنسيقات الأخرى. يمكن لخيار "To Text" أيضًا استخراج جميع البيانات النصية من ملف PDF أو إجراء OCR إذا تم مسح المستندات ضوئيًا أو تصويرها. يوفر إصدار Pro مكونًا إضافيًا لـ OCR يمكنك تنشيطه بسرعة لتحويل ملفات PDF الممسوحة ضوئيًا إلى نص قابل للبحث والقراءة والتحرير.
بالإضافة إلى ذلك ، يمكنك استخدام PDFelement لتحرير ملفات PDF ، والتعليق عليها ، وتأمينها بتشفير كلمة المرور ، والتوقيع الإلكتروني عليها ، وإنشاء نماذج PDF ، وتعديل النماذج وملؤها ، وحتى تحويل النماذج غير التفاعلية إلى نماذج تفاعلية وقابلة للتعبئة بالكامل.
إليك كيفية تحويل PDF إلى HTML:
- الخطوة 1. يمكنك سحب وإفلات مستند PDF مباشرة إلى أيقونة PDFelement أو في الواجهة إذا كانت مفتوحة ؛ يمكنك أيضًا استخدام خيار "فتح الملفات" في الصفحة الرئيسية أو طريقة "ملف" ← "فتح" من داخل البرنامج.
- الخطوة 2. انقر فوق علامة تبويب "تحويل" في الأعلى وزر "إلى نص" على شريط الأدوات. سترى أيضًا خيار "تحويل ملف PDF" على الصفحة الرئيسية ، وهو موجود من أجل الراحة. سيؤدي أي من هذين الخيارين إلى فتح مربع حوار لإعدادات التحويل. إذا كانت البيانات غير قابلة للتحرير ، سيطالبك البرنامج بـ "إجراء OCR" قبل استخراج النص. في هذه المرحلة ، يمكنك أيضًا اختيار تحويل ملف PDF إلى HTML أو أي تنسيق آخر تريده.
- الخطوة 3. قم بتأكيد الإعدادات وانتظر حتى يتم إنشاء ملف الإخراج الخاص بك.
من المعروف أن PDFelement أسرع وأكثر موثوقية في تحويل أنواع الملفات المختلفة من PDF إلى تنسيقاتها الأصلية. هناك أيضًا العديد من القواعد المحددة التي يمكنك تطبيقها قبل التحويل ، وهي تمنحك حرية أكبر من معظم برامج تحرير PDF الأخرى.
الأداة # 2 - كيفية تحويل PDF إلى نص عادي عبر الإنترنت مجانًا
أحد الخيارات المجانية لتحويل ملفات PDF الخاصة بك إلى ملفات نصية عادية هو استخدام محرر PDF عبر الإنترنت مثل hipdf. الخدمة مجانية ، وإذا كان لديك اتصال قوي يوفر لك اتصالاً عالي السرعة بالإنترنت ، فقد يكون هذا خيارًا أفضل من تنزيل تطبيق لتحويلات PDF. هذا صحيح بشكل خاص إذا كنت لا تقوم بمثل هذه المهام كثيرًا.إليك فيما يلي الخطوات:
- 1. انتقل إلى صفحة hipdf الرئيسية وانقر على "جميع الأدوات" في العنوان واختر "PDF إلى HTML" أو أي خيار آخر تفضله.
- 2. يمكنك الآن فتح ملفاتك من حساب Drive أو Dropbox ، أو استخدام زر "اختيار ملف" ، أو سحب الملفات بسهولة إلى المنطقة المحددة بعلامة تبويب المتصفح.
- 3. اضغط على زر "تحويل" ، وانتظر حتى يصل شريط التقدم إلى 100٪ ، ثم اضغط على زر "تنزيل" ، أو أيقونة التنزيل بجوار اسم الملف ، أو إحدى خدمات التخزين السحابية التي قمت بتسجيل الدخول إليها بالفعل . على هذا الجهاز. احفظ الملف وها قد انتهيت.
باستخدام hipdf ، يكون التحويل نظيفًا ويتم استخراج جميع عناصر النص بدقة في ملف .txt. إذا كنت قلقًا بشأن سرقة البيانات عبر الإنترنت ، فمن الأفضل لك استخدام تطبيق قابل للتنزيل مثل PDFelement. إنه متاح للتنزيل ليس فقط على نظامي التشغيل Windows و Mac ، ولكن أيضًا على نظامي iOS و Android. بناءً على اشتراكك ، يمكنك الوصول إلى الميزات القياسية والمهنية عبر جميع أجهزتك.
ما هو النص العادي
أبسط تعريف للنص العادي هو في الواقع الاسم ذاته. فكر في برنامج خالٍ من أي عناصر رسومية أو أي كائنات أخرى بخلاف الأحرف والأرقام والمسافات وفواصل الأسطر وعلامات الترقيم والمحتويات الأساسية الأخرى التي يمكن قراءتها. لا توجد خيارات لتنسيق النص ، لكنه يدعم بعض رموز الأحرف الخاصة. أفضل طريقة لفهم النص العادي هي النظر إلى النص المنسق ، وهونص عادي بشكل أساسي مع جميع المعلومات أو البيانات الوصفية المصاحبة التي تحمل معلومات النمط للخط واللون والروابط وما إلى ذلك.
ما هو الفرق بين النص العادي و HTML
تمامًا بالطريقة التي يضيف بها النص المنسق جميع السمات وعناصر النمط إلى النص العادي ، يتقدم HTML خطوة إلى الأمام من خلال السماح لك بتضمين الصور والتصميمات ومقاطع الفيديو والسمات والعناصر الرسومية المتقدمة الأخرى. ومع ذلك ، فإن النص العادي يمكن الاعتماد عليه بشكل أكبر لأنه لا يعرف الجهاز. إذا قمت بإرسال بريد إلكتروني بتنسيق HTML ، على سبيل المثال ، ولم يتمكن تطبيق البريد الإلكتروني الخاص بالمستلم من فتحه ، فسيتم تعيينه افتراضيًا في وضع النص العادي.
بعد ذلك ، دعنا نلقي نظرة على بعض الأدوات - سواء عبر الإنترنت أو في وضع عدم الاتصال (قابلة للتنزيل) - التي يمكنك استخدامها لتحويل PDF إلى نص عادي. يكون هذا مفيدًا للغاية عندما تريد مراجعة مستند بدون أي من الصور أو أي "مشتتات" رسومية أخرى في عنصر PDF نموذجي. سيقوم باستخراج النص بمفرده وإعطائك ذلك بتنسيق يمكن قراءته ؛ أي ملف نصي عادي بامتداد .txt.