سلام، لطفا وارد شوید یا عضو شوید.

نویسنده موضوع: کپی و چسباندن یک متن فارسی از فایل PDF به word  (دفعات بازدید: 42082 بار)

آفلاین محمد چهارسوقی

  • Global Moderator
  • Sr. Member
  • *****
  • تشکر
  • -اهدا شده: 82
  • -دریافت شده: 55
  • ارسال: 330
    • ديدن مشخصات
    • سایت شخصی محمد چهارسوقی
امروز هنگام کپی و چسباندن یک متن فارسی از درون فایل PDF و انتقال آن به فایل word  با یک پدیده‌ای مواجه شدم که نمی‌دانم آیا طبیعی است یا نه. و اینکه آیا حل شدنی است یا خیر.

چند پاراگراف معمولی با فونت یاس نوشتم که خروجی pdf آن را برایتان پیوست کردم. در پاراگراف اول فقط از حروف اصلی استفاده کردم. در پاراگراف دوم از نیم فاصله و کاما و خط کسره و علامت سوال استفاده کردم که متن در هنگام انتخاب و در نتیجه چسباندن بهم ریخت.

با تکرار پاراگراف و کم و زیاد کردن علائم خاص به این نتیجه رسیدم که با علامت سوال و همزه مشکلی ندارد. با علامت کسره بعضی جاها مشکل دارد و بعضی جاها مشکل ندارد!! مثلا در پارگراف سوم کسره بعد از کلمه نظر درست نمایش داده شده و باعث قطع جمله نشده اما در همین پارگراف کسره بعد از کلمهٔ متن مشکل‌ساز شده. همچنین به نظر می‌رسد با نیم‌فاصله همیشه مشکل داشته باشد.

آیا طبیعی است و یا می‌توان کاری کرد؟
ممنون

آفلاین سروش

  • Newbie
  • *
  • تشکر
  • -اهدا شده: 3
  • -دریافت شده: 3
  • ارسال: 32
    • ديدن مشخصات
من قبلاً با این مشکل مواجه شدم.
یه فایل pdf‌ بود که باید صفحه‌بندیش می‌کردم و تعداد زیادی '«' و '»' داشت. بعد از کلی انگولک کردن متوجه شدم هر وقت متن با کاراکترهای خاصی مواجه میشه، جهت متن انتخاب شده عوض میشه. مثلاً اگر داخل pdf داشته باشید:
متن اولی «متن دومی» متن سومی
بعد از کپی کردن به شکل زیر در میاد:
متن سومی »متن دومی« متن اولی

فکر کنم به خاطر روش acrobat برای تشخیص جهت کاراکترها باشه. من روش‌های خیلی زیادی رو برای حل این مشکل امتحان کردم. از converter گرفته تا تبدیل pdf به تصویر و استفاده از OCR، اما فایده‌ای نداشت. تنها کاری که تونستم بکنم این بود که از یک برنامۀ کوچیک برای تبدیل pdf‌ به html استفاده کردم. که البته متن اصلی خیلی خیلی بیشتر به هم خورد ولی لااقل جهت‌ها عوض نمی‌شدن.

آفلاین هادی صفی‌اقدم

  • ویرایشگر
  • Hero Member
  • *
  • تشکر
  • -اهدا شده: 789
  • -دریافت شده: 1353
  • ارسال: 5,644
    • ديدن مشخصات
آکروبات شما تنظیم نیست

از منوی edit گزینه‌ی preferences و سپس  را انتخاب کنید International و گزینه‌ی Default Rendering Direction را روی Right to Left قرار دهید


آفلاین سروش

  • Newbie
  • *
  • تشکر
  • -اهدا شده: 3
  • -دریافت شده: 3
  • ارسال: 32
    • ديدن مشخصات
قبلاً با آکروبات ۸ همین رو امتحان کرده بودم و درست نشده بود. حالا با ۹ هم امتحان کردم، بازم فایده‌ای نداره.

آفلاین هادی صفی‌اقدم

  • ویرایشگر
  • Hero Member
  • *
  • تشکر
  • -اهدا شده: 789
  • -دریافت شده: 1353
  • ارسال: 5,644
    • ديدن مشخصات
قبلاً با آکروبات ۸ همین رو امتحان کرده بودم و درست نشده بود. حالا با ۹ هم امتحان کردم، بازم فایده‌ای نداره.
من با آکروبات ۸ و ۹ تست کردم و جواب گرفتم. نمونه فایل خودم را هم ضمیمه کرده ام و همه سطرها را درست تبدیل کرده است.

آفلاین سروش

  • Newbie
  • *
  • تشکر
  • -اهدا شده: 3
  • -دریافت شده: 3
  • ارسال: 32
    • ديدن مشخصات
با فایل من جواب نمیده. البته این فایل قدیمیه و با آکروبات ۶ ساخته شده. توی لینوکس یک pdf درست کردم و با آکروبات ۸ ویندوز تست کردم مشکلی نداشت. فکر کنم برای نسخه‌های قدیمی pdf‌ کار نمی‌کنه.

برای مثال متن توی عکس پیوست شده رو کپی کردم و به این شکل در اومده:

ایران- کنترا - » بوش افرادی را از بخش های مشکوک حزب جمهور یخواهان سال های 80 انتخاب کرده است، افرادی که در
بود که در ماه مارس بدون جنجال و تأیید شفاهی « ریچارد ارمیتاج » سهیم بودند. اولین انتصابش معاون وزیر امورخارجه « گیت
در سا لهای حکومت ریگان در مقام مشاور در بخش مسایل امنیتی بین المللی در وزارت امور خارجه « ارمیتاج » سنا صورت گرفت.
« آخرين ويرايش: اكتبر 04, 2010, 09:24:25 pm توسط سروش ربیعی »

 

مشکل تبدیل فارسی تک به word

نویسنده ساراانجمن فارسی‌تک FarsiTeX

پاسخ ها: 4
مشاهده: 7294
آخرين ارسال نوامبر 28, 2013, 04:04:52 pm
توسط حسن ذاکری
تبدیل فایل تک tex یا زی‌پرشین به ورد آفیس (Office Word)

نویسنده mbparsaانجمن عمومی

پاسخ ها: 8
مشاهده: 21302
آخرين ارسال ژوئیه 27, 2011, 07:44:36 pm
توسط سید مهدی موسوی
ایجاد واژه‌نامه‌ی فارسی به انگلیسی و بالعکس به صورت همزمان در یک فایل tex

نویسنده ابوالفضل دیانتانجمن حروف‌چینی مستندات

پاسخ ها: 19
مشاهده: 11656
آخرين ارسال اكتبر 21, 2013, 11:55:42 pm
توسط هادی صفی‌اقدم
فایل نمونه فارسی تک برای تایپ کتاب

نویسنده ايليا 1386انجمن فارسی‌تک FarsiTeX

پاسخ ها: 10
مشاهده: 15335
آخرين ارسال ژوئیه 06, 2012, 12:29:15 pm
توسط هادی صفی‌اقدم
خطای Ftexed MFC Application has stoped working موقع باز کردن فایل فارسی‌تک

نویسنده هادی صفی‌اقدمانجمن فارسی‌تک FarsiTeX

پاسخ ها: 0
مشاهده: 1759
آخرين ارسال ژانویه 01, 2013, 05:36:10 am
توسط هادی صفی‌اقدم
خروجی فایل تک فارسی با زی پرشین بدون نصب بودن تک فارسی در سیستم

نویسنده دیدابانجمن تک پارسی TeX-e-Parsi

پاسخ ها: 0
مشاهده: 3240
آخرين ارسال ژوئیه 29, 2014, 12:23:15 am
توسط دیداب
تبدیل فایل texبه word

نویسنده komailalvandiانجمن عمومی

پاسخ ها: 2
مشاهده: 5279
آخرين ارسال سپتامبر 23, 2014, 12:01:38 am
توسط وحید دامن‌افشان
مبدل فارسی‌تک به یونیکد (نسخه پرتابل ویندوز)

نویسنده مهدی امیدعلیانجمن فارسی‌تک FarsiTeX

پاسخ ها: 4
مشاهده: 7144
آخرين ارسال ژوئیه 06, 2014, 01:03:01 pm
توسط neda.pouyan