Arabic.AI Suite / OCR
Powered by Arabic.AI OCR

Turn any document into
perfectly extracted text.

Drop a PDF and we read handwritten and printed Arabic & English with industry-leading accuracy, keeping the structure intact.

— Live preview —

Watch it read a real document.

A signed CEO statement, scanned and messy. Dropped into the OCR engine and back out as clean, structured text — in seconds.

OCR Scan
Drop a PDF and we'll extract the text, preserving structure and layout.
Waiting for file
Drop a PDF to scan
PDF only
CEO-statement-letter.pdf
خطاب-الرئيس-التنفيذي.pdf
صفحة 1 من 1
ARABIC.AI دبي ديزاين ديستركت · الرياض
15 يناير 2026
إلى: مجلس الإدارة
من: مكتب الرئيس التنفيذي
المراجعة الاستراتيجية للربع الرابع 2025
أعضاء مجلس الإدارة الكرام،
يسرّني أن أُبلغكم بأن الربع المنصرم كان نقطة تحوّل لمؤسستنا. ارتفعت الإيرادات بنسبة 28% على أساس سنوي، مدفوعةً بالطلب المتواصل على الذكاء الاصطناعي العربي السيادي في منطقة الشرق الأوسط وشمال إفريقيا. وأقفلنا العام عند 42 مليون دولار من الإيرادات السنوية المتكررة، مع نسبة احتفاظ بالعملاء بلغت 98%، وتوسّعنا في سوقَين جديدَين.
على صعيد عام 2026، تتمحور أولوياتنا حول ثلاثة محاور: تعميق منصّتنا المؤسسية، وتوسيع مصنع الوكلاء الذكية، وإطلاق الجيل القادم من Pronoia. تجدون الخطط التفصيلية مرفقةً طيّه.
نور الحسن
نور الحسن
المؤسِّسة والرئيسة التنفيذية
Extracted text
Markdown
Extracted text will appear here
Press Extract to begin
H1 المراجعة الاستراتيجية للربع الرابع 2025
Meta التاريخ: 15 يناير 2026
إلى: مجلس الإدارة
من: مكتب الرئيس التنفيذي
أعضاء مجلس الإدارة الكرام،
P
يسرّني أن أُبلغكم بأن الربع المنصرم كان نقطة تحوّل لمؤسستنا. ارتفعت الإيرادات بنسبة 28% على أساس سنوي، مدفوعةً بالطلب المتواصل على الذكاء الاصطناعي العربي السيادي في منطقة الشرق الأوسط وشمال إفريقيا. وأقفلنا العام عند 42 مليون دولار من الإيرادات السنوية المتكررة، مع نسبة احتفاظ بالعملاء بلغت 98%، وتوسّعنا في سوقَين جديدَين.
P
على صعيد عام 2026، تتمحور أولوياتنا حول ثلاثة محاور: تعميق منصّتنا المؤسسية، وتوسيع مصنع الوكلاء الذكية، وإطلاق الجيل القادم من Pronoia. تجدون الخطط التفصيلية مرفقةً طيّه.
Signature
نور الحسن المؤسِّسة والرئيسة التنفيذية
/ 01 — What it does

OCR built for Arabic. Tuned for enterprises.

Most OCR engines treat Arabic as a second-class citizen. Ours was built for it first — printed, handwritten, bilingual, and structurally complex.

Reads everything

Printed or handwritten. Arabic or English. Clean scans or blurred phone photos. Our model handles bilingual documents without switching modes or losing context.

Arabic handwriting recognition
Mixed Arabic/English in the same page
Stamps, signatures, and official seals detected

Keeps the structure

Headings stay headings. Tables stay tables. Columns, bullets, signatures, and reading order all survive the round trip. You get back a document you can actually use, not a wall of text.

Table cells preserved with row/column mapping
Heading hierarchy auto-detected (H1–H4)
Correct RTL reading order for Arabic

Drops into your workflow

Export to whatever you already use — Markdown, JSON, searchable PDF, DOCX, plain text, or structured CSV. Or plug the OCR API straight into your existing pipeline.

6 output formats, one click each
REST API with batch processing
Webhook callbacks on completion
/ 02 — What you scan

Every paper your organization still deals with.

Contracts & agreements

Scanned, signed, stamped. Every clause extracted.

IDs & passports

Emirates ID, Iqama, passports, visas — structured fields.

Forms & applications

Government forms, HR intake, KYC — field by field.

Receipts & invoices

Line items, totals, VAT numbers into clean tables.

Bank statements

Multi-column tables, running balances, intact.

Handwritten notes

Board notes, meeting scribbles, field reports.

Tender dossiers

Hundreds of scanned pages, back into machine-readable.

Archives & old books

Historical Arabic manuscripts, yellowed records, faded ink.

/ 03 — Coverage

Takes anything in. Gives anything out.

Input formats

Every format you'd scan.

Native PDFs, scanned PDFs, phone photos, screenshots, faxes. Single page or 500-page dossiers. We handle it.

PDF JPG PNG TIFF HEIC BMP WEBP Multi-page Up to 500 pages Up to 100 MB
Output formats

Every format you'd want back.

Pick the format your pipeline actually reads. All exports keep the document's original structure and reading order.

Markdown JSON DOCX Searchable PDF Plain text CSV HTML XML (Alto)

Enterprise-grade by default.

Sensitive documents never leave your perimeter. No retention, no training on your content, no guesswork about where data lives.

Zero training

Your scans never touch our training pipeline.

In-region hosting

UAE, KSA, your own VPC, or fully on-prem.

ISO 27001

Security controls independently certified.

Auto-redaction

PII detected and masked before extraction if needed.

/ 04 — Rest of the suite

Three more surfaces, one Arabic brain.

OCR is one of four surfaces in the Arabic.AI Suite. Explore the rest.

/ Get started

Scan your first document in a minute.

Book a 30-minute walkthrough and we'll scan your own documents live on the call — or explore the platform yourself at suite.arabic.ai.