API تبدیل فایل PDF به متن فارسی
در مقاله قبل در مورد وب سرویس تبدیل عکس به متن فارسی توضیح دادیم در این مقاله قصد داریم در مورد وب سرویس تبدیل pdf به متن صحبت کنیم.
این وب سرویس در قالب سرویس API Web طراحی شده و از طریق هر نوع کلاینت قابل دسترس میباشد.
برای دسترسی به این سرویس از طریق API Web از آدرسهای زیر استفاده کنید:
https://www.iranocr.ir/api/OCR_Picture
https://www.iranocr.ir/api/OCR_PDF
https://www.iranocr.ir/api/Get_DOCX
https://www.iranocr.ir/api/Get_TXT
https://www.iranocr.ir/api/OCR_PicLink_Get_TXT
برای استفاده باید در وبسایتiranocr.ir ثبت نام و بسته با اعتبار صفحه را خریداری نمایید. وبسایت iranocr.ir برای تامین امنیت از SSL شرکت letsencrypt.org استفاده میکند.
پارامترهای ورودی هر API در ادامه توضیح داده میشود.
متد OCR_PDF
این متد جهت ارسال اطلاعات یک PDF و انجام عملیات OCR بر روی آن میباشد (یک صفحه در هر فراخوانی). ورودی و خروجی این متد به شرح زیر است:
پارامتر ورودی | نوع | توضیحات |
UserName | string | نام کاربری ثبت نام شده در وبسایت |
WebServiceKey | string | کلید وب سرویس |
WebServicePassword | string | کلمه عبور وب سرویس |
file | file | محتوای PDF |
PDFFileName | string | نام کامل PDF
مثال : test. PDF |
PDFPageNumber | string | شماره صفحه مورد نظر |
LanguageTag | string | زبان متن موجود در عکس
استاندارد کد ISO 639-1 |
مقدار خروجی | توضیحات |
ERR_USER_CREDIT_NOT_VALID | عدم اعتبار کاربر |
ERR_OCR_FAIL | خطا در مراحل OCR |
ERR_CREDIT_LOW | میزان اعتبار کافی نیست |
ERR_PIC_NOT_VALID | عدم اعتبار فایل PDF |
ERR_WSPASS_NOT_VALID | عدم اعتبار کلمه عبور وبسرویس |
ERR_WS_NOT_VALID | عدم اعتبار کلید وبسرویس |
ERR_File_NA | عدم وجود فایل در درخواست |
ERR_Exception | خطای ناشناخته |
رشته متنی HEX | شناسه فایل تبدیل شده جهت دانلود |
این مقاله در مورد وب سرویس تبدیل pdf به متن بود در مقاله بعدی API تبدیل عکس به متن باurl را معرفی میکنیم