دليل شامل لتحويل الصوت إلى نص على Mac: إعدادات واستخدام الإدخال الصوتي في macOS

28 فبراير 2026

دليل شامل لتحويل الصوت إلى نص على Mac: إعدادات واستخدام الإدخال الصوتي في macOS

ثماني ساعات من الكتابة، 4000 كلمة، ومعصماك يذكرانك بأن لهما حدودًا. تقوم بتشغيل خاصية تحويل الصوت إلى نص في Mac (المعروفة بـ Mac Dictation)، وتبدأ في التحدث، وتشاهد أول جملتين تظهران بشكل مثالي. ثم تتوقف للتفكير لمدة 30 ثانية، فينطفئ Mac Dictation من تلقاء نفسه. تعيد تشغيله، وتتحدث بشكل أسرع هذه المرة، فتلاحظ أنه يضع أحرفًا كبيرة لكلمات عشوائية ويتجاهل كل فاصلة. ومع الوصول للمرة الثالثة لإعادة التشغيل، تكتشف أنك قضيت وقتًا في محاربة الأداة أكثر مما كنت ستقضيه في الكتابة.

إن ميزة تحويل الصوت إلى نص المدمجة في Mac هي أكثر قدرة مما يدركه معظم المستخدمين، ولكن سلوكها الافتراضي قد يكون غير بديهي، وإعداداتها موزعة على عدة لوحات نظام، ولا تعلن عن ميزاتها الأكثر فائدة. يكتب الشخص العادي حوالي 40 كلمة في الدقيقة، بينما يلتقط الإدخال الصوتي في Mac ما بين 130 إلى 160 كلمة في الدقيقة. هذا الربح في السرعة بمقدار 3-4 أضعاف حقيقي بمجرد ضبط الإعدادات بشكل صحيح، ولكنه لا يساوي شيئًا إذا استمر الإملاء في التوقف التلقائي بعد حوالي 30 ثانية من الصمت.

الإملاء في Mac في عام 2026: محركان، ومفتاح تبديل واحد محير

تشحن Apple حاليًا نظامين للإملاء في macOS، وتؤثر الفروق بينهما على الدقة والخصوصية والمدة التي يمكنك فيها الإملاء دون انقطاع.

الميزةالإملاء المحسن (على الجهاز)الإملاء القياسي (عبر الخادم)
المعالجةعلى جهاز Mac الخاص بك، لا حاجة للإنترنتتتطلب خوادم Apple اتصالاً بالإنترنت
الإملاء المستمرنعم، لا يوجد حد زمنييتوقف تلقائيًا بعد فترات التوقف
الخصوصيةالصوت لا يغادر جهازك أبدًايتم إرسال الصوت إلى Apple لمعالجته
الدقةجيدة جدًا للغات المدعومةأفضل قليلاً للحالات النادرة
التخزينتنزيل 1-2 جيجابايت لكل لغةلا حاجة لتخزين محلي
التوفرmacOS Ventura 13+ مع Apple Siliconجميع إصدارات macOS

في أجهزة Mac التي تعمل برقاقات Apple Silicon ونظام macOS Ventura أو أحدث، يكون الإملاء على الجهاز هو الخيار الافتراضي. فهو يعالج الكلام محليًا باستخدام Neural Engine، لذا لا تنتهي مهلته، ولا يتطلب اتصال Wi-Fi، ولا يرسل صوتك إلى خوادم Apple.

أما في أجهزة Mac القديمة التي تعمل بمعالجات Intel، فأنت مقيد بالإملاء المستند إلى الخادم الذي يتطلب اتصالاً بالإنترنت ويميل إلى التوقف التلقائي بعد فترات توقف قصيرة. سلوك التوقف التلقائي هذا هو ما يحبط معظم المستخدمين الذين يجربون الإملاء مرة واحدة ثم يستسلمون.

إذا لم تكن متأكدًا من الإصدار الذي تستخدمه، فراجع System Settings > Keyboard > Dictation. إذا رأيت جملة "On-Device Dictation" مذكورة، فأنت تستخدم المحرك المحلي.

إعداد الإملاء: الطريقة الصحيحة (وليس الطريقة الواضحة)

يكتشف معظم الناس خاصية الإملاء بالصدفة عندما يضغطون على مفتاح الميكروفون في لوحة المفاتيح. الإعداد بسيط، ولكن هناك إعدادان غير واضحين يؤثران بشكل كبير على التجربة.

الإعداد الأساسي

  1. افتح System Settings (قائمة Apple > System Settings)
  2. انقر على Keyboard في الشريط الجانبي
  3. مرر لأسفل إلى Dictation وقم بتشغيله
  4. اختر Language الخاصة بك (يمكنك إضافة لغات متعددة)
  5. اضبط الاختصار الخاص بك Shortcut (الافتراضي هو الضغط على مفتاح Fn مرتين، ولكن خيار "Press Fn" أو اختصار مخصص متاح أيضًا)
  6. إذا طلب منك ذلك، قم بتنزيل نموذج التعرف على الكلام على الجهاز للغتك

الإعدادان اللذان يغفل عنهما معظم الناس

التنقيط التلقائي (Auto-punctuation). بدءًا من macOS Sonoma، فعلت Apple التنقيط التلقائي افتراضيًا. يقوم الإملاء بإدراج النقاط والفواصل وعلامات الاستفهام بناءً على أنماط حديثك دون أن تقول "نقطة" أو "فاصلة" بصوت عالٍ. إذا كان هذا لا يعمل معك، فتأكد من أنك تستخدم نظام macOS 14 أو أحدث وأن لغة الإملاء هي الإنجليزية أو الإسبانية أو الفرنسية أو الألمانية أو الإيطالية أو البرتغالية أو الصينية أو الكورية أو اليابانية (التنقيط التلقائي لا يدعم جميع اللغات بعد).

مصدر الميكروفون. افتراضيًا، يستخدم macOS أي ميكروفون تم تكوين النظام لاستخدامه. إذا كنت تحصل على دقة ضعيفة، فغالبًا ما يكون الحل في الأجهزة وليس البرامج. اذهب إلى System Settings > Sound > Input وتأكد من أنه يشير إلى أفضل ميكروفون لديك. حتى ميكروفون USB رخيص، إذا وضع بالقرب من فمك، فإنه يحسن دقة الإملاء بشكل ملحوظ مقارنة بالميكروفون المدمج.

كيف تملي بالفعل على Mac (تطبيق تلو الآخر)

بمجرد تمكين الإملاء على Mac، يعمل التنشيط بنفس الطريقة في كل مكان: اضغط على اختصارك (الافتراضي: Fn مرتين)، ابدأ في التحدث، واضغط على الاختصار مرة أخرى للتوقف. لكن السلوك يختلف قليلاً عبر التطبيقات.

Pages و TextEdit

أنظف تجربة إملاء على Mac. ضع المؤشر، وفعل خاصية تحويل الصوت إلى نص في Mac، وتحدث. يظهر النص في الوقت الفعلي. يمكنك الإملاء بشكل مستمر مع التبديل بين الكتابة والتحدث. في نظام macOS Sonoma والإصدارات الأحدث، لست بحاجة إلى إيقاف Mac Dictation لإجراء تعديل سريع باستخدام لوحة المفاتيح.

Notes

يعمل بشكل جيد للعصف الذهني وملاحظات الاجتماعات. إحدى الحيل المفيدة: أنشئ ملاحظة جديدة، وابدأ الإملاء، واستخدمها كمسودة صوتية. تتم مزامنة Notes مع iCloud، لذا فإن النص الذي أمليته متاح فورًا على iPhone و iPad.

Mail

يعمل Mac Dictation في نافذة إنشاء الرسائل. مفيد للردود الطويلة على رسائل البريد الإلكتروني حيث تبدو الكتابة مملة. ملاحظة بسيطة: إذا قمت بإملاء عنوان URL أو عنوان بريد إلكتروني، فستنخفض الدقة بشكل كبير. قم بتهجئتها حرفًا بحرف أو اكتبها يدويًا.

Safari و Chrome (حقول النصوص)

يعمل الإملاء في أي حقل نصي على الويب، بما في ذلك Google Docs و Notion و Slack وصناديق إنشاء المنشورات في وسائل التواصل الاجتماعي. ومع ذلك، تتعامل محررات النصوص المستندة إلى الويب أحيانًا مع الإدراج في الوقت الفعلي بشكل مختلف، مما قد يسبب مشاكل في قفز المؤشر. إذا لاحظت ظهور النص في مكان خاطئ، فانقر لإعادة وضع المؤشر وأعد تشغيل الإملاء.

Terminal

من الناحية التقنية يعمل الإملاء في Terminal، ولكنه ليس عمليًا. بناء جمل الأوامر والأعلام ومسارات الملفات لا تترجم جيدًا عبر التعرف على الكلام. التزم بالكتابة في Terminal.

الأوامر الصوتية التي تحول الإملاء إلى تحرير فعلي

يملي معظم مستخدمي Mac النص، ثم ينتقلون إلى لوحة المفاتيح والماوس لإصلاح كل شيء. هذا يعني فقدان نصف القيمة. يدعم macOS الأوامر الصوتية للتنقيط والتنسيق والتحرير الأساسي، مما يلغي معظم عمليات التنظيف بعد الإملاء.

التنقيط (قل هذه الكلمات أثناء الإملاء):

  • "Period" / "Full stop" (نقطة)
  • "Comma" (فاصلة)
  • "Question mark" (علامة استفهام)
  • "Exclamation point" (علامة تعجب)
  • "Colon" / "Semicolon" (نقطتان / فاصلة منقوطة)
  • "Open quote" ... "Close quote" (فتح علامة تنصيص ... إغلاق علامة تنصيص)
  • "Open parenthesis" ... "Close parenthesis" (فتح قوس ... إغلاق قوس)
  • "Dash" (شرطة)
  • "Ellipsis" (نقاط حذف)

التحكم في السطر والفقرة:

  • "New line" (سطر جديد)
  • "New paragraph" (فقرة جديدة)
  • "Tab key" (مفتاح التبويب)

أوامر التحرير:

  • "Select previous word" / "Select next word" (تحديد الكلمة السابقة / التالية)
  • "Select all" (تحديد الكل)
  • "Delete that" (حذف ذلك - يزيل آخر عبارة تم إملاؤها)
  • "Undo" (تراجع)
  • "Caps on" ... "Caps off" (لتكبير الأحرف في الأجزاء بالإنجليزية)
  • "Numeral [number]" (يفرض التنسيق الرقمي، مثلاً: "numeral 5" ← 5 بدلاً من "five")

إليك الشيء الذي لا يدركه معظم الناس: يمكنك المزج بين الكتابة والإملاء في الوقت الفعلي في نظام macOS Sonoma والإصدارات الأحدث. أملِ فقرة، واستخدم الماوس للنقر في مكان آخر، واكتب تصحيحًا، ثم استأنف الإملاء. لم يعد السلوك القديم الذي يخيرك بين "الإملاء أو الكتابة، وليس كليهما" موجودًا في الأنظمة الأحدث.

عوامل إضعاف الدقة الخمسة (وكيفية إصلاح كل منها)

إذا كانت دقة Mac Dictation تبدو أسوأ مما ينبغي، فغالبًا ما يكون أحد هذه العوامل الخمسة هو المسؤول.

1. ميكروفون اللابتوب المدمج في غرفة صاخبة. هو أكبر قاتل للدقة على الإطلاق. تم تصميم ميكروفونات MacBook لمكالمات FaceTime، وليس للإملاء المستمر. ميكروفون مكثف (Condenser) بوصلة USB (بقيمة 15-30 دولارًا)، يوضع على بعد 6-8 بوصات من فمك، سيزيد الدقة من 85% تقريبًا إلى أكثر من 95% في بيئة هادئة.

2. التحدث بسرعة كبيرة دون فواصل. يعالج الإملاء الكلام في كتل. إذا قمت بدمج الجمل معًا دون فواصل طبيعية، يفقد النموذج حدود السياق ويخطئ في نسب الكلمات. تحدث بوتيرة محادثة مع فواصل لمدة 0.5 ثانية بين الجمل. أبطأ من وتيرة تحدثك الطبيعية، وأسرع من النطق المتأني المبالغ فيه.

3. اللكنات أو اللهجات غير القياسية. يتعامل نموذج Apple مع اللكنات الإنجليزية الرئيسية بشكل جيد (الأمريكية، البريطانية، الأسترالية) ولكنه يواجه صعوبة مع اللهجات الإقليمية القوية واللكنات غير الأصلية الثقيلة. تميل المعالجة على الجهاز إلى أن تكون أكثر تسامحًا قليلاً من المعالجة القائمة على الخادم لأن النموذج يعمل بسياق مستمر، ولكن الفجوة لا تزال ملحوظة للمتحدثين الذين لديهم أنماط لكنة أقل شيوعًا.

4. تداخل الصوت في الخلفية. موسيقى، تلفزيون، أو أشخاص آخرون يتحدثون. حتى لو كان الصوت منخفضًا، فإن تداخل الأصوات يربك النموذج. استخدم سماعات الرأس للاستماع واترك قناة الميكروفون نظيفة لصوتك فقط.

5. عدم تدريب النظام. يتعلم macOS من أنماط إملائك بمرور الوقت، ولكن فقط إذا قمت بتصحيح الأخطاء باستخدام لوحة المفاتيح (وليس عن طريق إعادة إملاء الكلمة فوق الخطأ). عندما يخطئ الإملاء في كلمة، انقر عليها، واكتب التصحيح، واكمل. على مدار أيام وأسابيع، تتحسن الدقة بالنسبة لمفرداتك الخاصة وأنماط حديثك.

أين يقف حدود الإملاء في Mac (وماذا تستخدم بدلاً منه)

إن Mac Dictation جيد حقًا للغرض المقصود منه: تحويل الكلام المباشر إلى نص في الوقت الفعلي، لمتحدث واحد، وميكروفون واحد، ولغة واحدة في كل مرة. ولكن لديه حدود صارمة لا يمكن لأي ترقية للميكروفون أو تدريب إصلاحها.

لا يوجد تفريغ لملفات الصوت. لا يمكنك إعطاء الإملاء ملف MP3، أو تسجيل Zoom، أو مذكرة صوتية. هو يعالج فقط مدخلات الميكروفون المباشرة. إذا كان لديك مقابلة مسجلة، أو محاضرة، أو بودكاست، أو اجتماع يحتاج إلى تفريغ، فلن يتمكن الإملاء من المساعدة في ذلك.

لا يوجد تحديد لهوية المتحدث. ليس لدى الإملاء مفهوم لمن يتحدث. إذا كنت تقوم بتفريغ مقابلة بين شخصين من خلال تشغيلها عبر مكبرات الصوت (خدعة الالتفاف الصوتي)، فستحصل على جدار من النص غير المتمايز بدون أسماء المتحدثين.

لغة واحدة فقط في الجلسة. يمكنك الإملاء باللغة الإنجليزية أو الإسبانية، ولكن ليس كلتيهما في نفس الجلسة. يتطلب التبديل بين اللغات إيقاف Mac Dictation، وتغيير إعداد اللغة، وإعادة تشغيل Mac Dictation. بالنسبة للمتحدثين بلغتين أو المحتوى متعدد اللغات، يعد هذا عائقًا لسير العمل.

لا توجد طوابع زمنية. ينتج الإملاء نصًا بسيطًا. لا توجد طريقة للحصول على طوابع زمنية للرجوع إلى الصوت، وهو أمر يهم الصحفيين والباحثين وأي شخص يحتاج إلى تتبع النص للوصول إلى لحظة محددة في التسجيل.

سقف الدقة مع الصوت غير المثالي. يفترض الإملاء وجود كلام نظيف ومباشر للميكروفون. بمجرد أن تنخفض جودة الصوت، ولو قليلاً (تسجيلات الهاتف، صدى الغرفة، ضوضاء الشارع)، تنخفض الدقة إلى نقطة يصبح فيها تحرير النص يستغرق وقتًا أطول من الكتابة من الصفر.

من الإملاء المباشر إلى تفريغ الصوت الكامل مع Fish Audio

عندما تتجاوز احتياجاتك حدود "إملاء أفكارك الخاصة" إلى "تفريغ الصوت المسجل"، تأتي أداة مخصصة لتحويل الكلام إلى نص لتكمل المهمة تمامًا من حيث يتوقف Mac Dictation.

تعتبر خدمة Fish Audio's Speech to Text مصممة للحالات التي لا يستطيع macOS التعامل معها. إليك ما سيتغير:

رفع أي ملف صوتي. MP3، WAV، M4A، مقابلات مسجلة، صادرات Zoom، مذكرات صوتية، حلقات بودكاست. ارفع الملف، واحصل على النص. لا توجد خدع تشغيل مباشر، ولا توجد مسارات التفاف صوتي، ولا انتظار في الوقت الفعلي. في وضع المعالجة الجماعية، توصف سرعة المعالجة عادةً بأنها حوالي 0.3-0.5 ضعف مدة الصوت (على سبيل المثال، قد ينتهي ملف مدته 10 دقائق في حوالي 3-5 دقائق)، لذا فإن الملفات الأطول تستغرق وقتًا أطول بشكل متناسب.

دقة تصمد أمام الصوت الحقيقي. تم تدريب نموذج Fish Audio على ظروف تسجيل متنوعة، بما في ذلك الصوت بجودة الهاتف، وصدى الغرفة، وضوضاء الخلفية، والكلام المتداخل. فجوة الدقة بين تسجيل استوديو ومقابلة في مقهى أصغر بكثير مما قد تحصل عليه من خدعة الالتفاف الصوتي في Mac Dictation.

تفريغ متعدد اللغات دون تبديل الجلسات. تسوق Fish Audio لخدمة تحويل الكلام إلى نص كداعم لأكثر من 100 لغة ولهجة؛ حيث تشير الأسئلة الشائعة الخاصة بـ STT صراحةً إلى دعم الإنجليزية والماندرين والكانتونية واليابانية والكورية، وتذكر أن التبديل بين اللغات (code-switching) يتم التعامل معه تلقائيًا. إذا كان تسجيلك يحتوي على تبديل بين الإنجليزية والماندرين أو الإسبانية والبرتغالية، فإن النموذج يتعامل مع انتقالات اللغة داخل نفس الملف بدلاً من طلب جلسات منفصلة.

سير العمل العملي لمستخدمي Mac:

  • المسودات المباشرة والعصف الذهني: استخدم Mac Dictation. إنه مجاني ومدمج وممتاز للإملاء الفردي في غرفة هادئة. اضغط على Fn مرتين، تحدث، وانتهى الأمر.
  • تفريغ الصوت المسجل: استخدم Fish Audio STT. ارفع الملف، واحصل على نص نظيف، والصقه في محرر نصوص Mac الخاص بك.
  • إنتاج صوت من نص جاهز: استخدم Fish Audio TTS مع أكثر من 2,000,000 صوت، وميزة استنساخ الصوت خلال 15 ثانية، ودعم 8 لغات.

تغطي هذه المجموعة دورة الصوت-إلى-نص-إلى-صوت الكاملة. يتعامل Mac Dictation مع جانب الإدخال المباشر مجانًا. بينما يتولى Fish Audio كل ما يتطلب معالجة ملفات الصوت، أو الدعم متعدد اللغات، أو المخرجات ذات الجودة الإنتاجية. الأداة تان يكملان بعضهما البعض بدلاً من التنافس.

التكلفة

الفئة المجانية من Fish Audio سخية بما يكفي للاختبار بتسجيلات حقيقية، وليس فقط عينات مقصوصة. تبدأ الخطط المدفوعة من 11 دولارًا شهريًا لـ 600,000 حرف من مخرجات TTS، مع تضمين استخدام STT. للسياق: تتقاضى خدمات التفريغ البشري المهنية ما بين 1 إلى 3 دولارات لكل دقيقة صوتية. تفريغ مقابلة لمدة 60 دقيقة سيكلف 60-180 دولارًا من تلك الخدمات، وسيستغرق 24-48 ساعة. بينما يعالج Fish Audio نفس الملف في أقل من دقيقتين. الأسعار الكاملة متوفرة هنا. fish-logo

الخاتمة

يعد Mac Dictation أكثر ميزات الإنتاجية غير المستغلة في macOS. قم بإعداده بشكل صحيح (الميكروفون المناسب، المحرك الموجود على الجهاز، تفعيل التنقيط التلقائي)، وتعلم عشرة أوامر صوتية، وستتمكن من صياغة المحتوى بسرعة تزيد عن سرعة كتابتك بـ 3-4 أضعاف دون أن يدفع معصماك الثمن. إنه جيد حقًا فيما يفعله.

ما لا يفعله هو تفريغ التسجيلات، أو التعامل مع لغات متعددة في جلسة واحدة، أو معالجة الصوت الذي لم يتم التحدث به مباشرة في ميكروفون Mac الخاص بك منذ لحظات. بالنسبة لسير العمل هذا، فإن المسار الأوضح هو الاحتفاظ بـ Mac Dictation للمدخلات المباشرة وإضافة Fish Audio لكل شيء آخر: تفريغ الملفات في جانب المدخلات، وتوليد الصوت الاحترافي في جانب المخرجات. ابدأ بالفئة المجانية واختبرها على أي تسجيل كان يقبع في تطبيق المذكرات الصوتية لديك بانتظار تحويله إلى نص.

الأسئلة المتكررة

لا، Mac Dictation مخصص للإدخال الصوتي المباشر فقط. لمعالجة الملفات المسجلة مثل المقابلات أو الاجتماعات، يمكنك استخدام خدمة Fish Audio المتخصصة.
استخدم ميكروفون USB خارجي عالي الجودة بدلاً من الميكروفون المدمج، وتأكد من تفعيل خاصية الإملاء على الجهاز (On-Device Dictation) وتحدث في بيئة هادئة.
نعم، بدءاً من إصدار macOS Sonoma، يمكنه إدراج النقاط والفواصل تلقائياً في عدة لغات منها الإنجليزية والفرنسية والألمانية واليابانية وغيرها.

أنشئ أصواتًا تبدو حقيقية

ابدأ في إنشاء أعلى جودة صوت اليوم

هل لديك حساب بالفعل؟ تسجيل الدخول

شارك هذه المقالة


Kyle Cui

Kyle CuiX

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

اقرأ المزيد من Kyle Cui >

المقالات الأخيرة

عرض الكل >