المخاطر غير المرئية المتبقية في PDF
يبدو PDF آمنا لأن مظهره ثابت.
لكن قد تبقى في PDF معلومات غير النص الظاهر على الشاشة.
مثل اسم المنشئ، وتطبيق الإنشاء، ووقت التحديث، والحواشي، والملفات المضمنة، والنص المخفي، وآثار المستند الأصلي.
عند مشاركة مستند باسم مجهول، من الخطر التفكير أن "تحويله إلى PDF يكفي".
تنظم هذه المقالة المخاطر غير المرئية التي تبقى في PDF، وما يجب فحصه قبل النشر.
لا يمكن الحكم على PDF من المظهر وحده
PDF صيغة مفيدة يمكن عرضها كأنها ورق.
لكن داخل ملف PDF قد توجد معلومات غير الصفحات المعروضة.
| المعلومة | المحتوى | نقطة الانتباه في المجهولية |
|---|---|---|
| المنشئ | اسم المستخدم أو معلومات التطبيق الذي صنع المستند | يقترب من الشخص أو اسم المنظمة |
| وقت الإنشاء | وقت الإنشاء أو التحديث | يرتبط بوقت السلوك أو التقديم |
| الحواشي | تعليقات، علامات، ملاحظات | يظهر مسار التحرير والأطراف المعنيون |
| التضمين | ملفات مرفقة، خطوط، صور | تبقى البيانات الأصلية أو بيئة الإنشاء |
| النص المخفي | OCR، نص للنسخ | قد تبقى معلومات ظننت أنك حجبتها |
حتى إذا كان مظهر PDF نظيفا، لا يعني ذلك أن معلوماته الداخلية نظيفة.
في المجهولية، افصل بين الصفحة المعروضة والمعلومات داخل الملف.
ما يختفي وما يبقى عند التحويل إلى PDF
عند تحويل مستند Office أو صورة إلى PDF، تتغير بعض المعلومات.
لكن لا تختفي كل المخاطر.
| ما يتغير بالتحويل | ما قد يبقى |
|---|---|
| يتحول المستند القابل للتحرير إلى عرض ثابت | المنشئ، تطبيق الإنشاء، وقت الإنشاء |
| تُضمّن الصورة كصورة | النص داخل الصورة، الخلفية، الانعكاسات |
| تثبت الخطوط والتخطيط | الخطوط المضمنة ومعلومات التطبيق |
| قد تختفي التعليقات | قد تبقى الحواشي أو سجل التغييرات بشكل آخر |
| يبدو كأنه خضع للتنقيح | قد يبقى النص تحته |
قد يكون تحويل PDF مفيدا في بعض الحالات.
لكن "حوّلته إلى PDF" يختلف عن "انتهى فحص المجهولية".
التنقيح والنص المخفي
من أخطر ما في PDF أن تحاول إخفاء المعلومات كأنك نقحتها.
إذا وضعت مستطيلا أسود فوق النص فقط، فقد يبقى النص تحته داخل الملف.
حتى إن لم يُقرأ من المظهر، قد يظهر النص الأصلي بالنسخ، أو البحث، أو الاستخراج، أو التحليل الداخلي.
| الطريقة | الخطر |
|---|---|
| وضع شكل أسود فوق النص | قد يبقى النص تحته |
| جعل لون النص مثل الخلفية | قد يظهر بالنسخ أو البحث |
| تحويله إلى لقطة شاشة | تدهور الجودة، ونص يقرأه OCR، وبقاء معلومات الخلفية |
| استخدام وظيفة تنقيح مخصصة | يلزم إعادة الفحص بعد المعالجة |
في المستندات التي تحتاج إلى تنقيح، استخدم وظيفة مخصصة، ثم افحص بعد المعالجة بالبحث والنسخ وفحص البيانات الوصفية.
في المستندات عالية الخطر، لا تحكم اعتمادا على المقالة وحدها، وفكر في استشارة خبير أو جهة دعم موثوقة.
معلومات المنظمة المتبقية في PDF
في الإبلاغ الداخلي ومواد التغطية، قد تصبح معلومات المنظمة داخل PDF مشكلة كبيرة.
ليست المشكلة في اسم المنشئ فقط؛ فالقالب، واسم القسم، ومسار الملف، والحواشي، ورقم التوزيع، والعلامة المائية، وصيغة أرقام الصفحات كلها مؤشرات.
| المؤشر | ما يمكن معرفته |
|---|---|
| اسم المنشئ | منشئ المستند أو حساب الجهاز |
| اسم الشركة | المنظمة أو بيئة الإنشاء |
| القالب | القسم أو تدفق العمل |
| صاحب الحاشية | من شارك في التحرير |
| العلامة المائية أو رقم التوزيع | جهة التوزيع أو مصدر المادة |
يبدو PDF "نسخة نهائية".
لكن لأنه نسخة نهائية تحديدا، قد تبقى فيه آثار أنه صُنع داخل منظمة.
سبب الخطر الخاص في الإبلاغ الداخلي ومواد التغطية
في الإبلاغ الداخلي ومواد التغطية، قد تشير معلومات PDF إلى "من كان يستطيع معرفة هذه المادة".
حتى إذا لم يظهر اسم في المستند نفسه، فإن نطاق التوزيع، ووقت التحديث، والحواشي، والعلامات المائية، وأرقام الصفحات، وأرقام المستندات، والقوالب الخاصة بقسم معين تضيق دائرة المرشحين.
| المؤشر داخل PDF | ما يُستنتج |
|---|---|
| رقم التوزيع | أي قسم أو أي شخص تسلم المادة |
| العلامة المائية | معلومات لتعريف القارئ أو جهة التوزيع |
| اسم صاحب الحاشية | من راجع أو من كان معنيا |
| وقت التحديث | من كان يستطيع العمل في ذلك الوقت |
| القالب | المنظمة، أو القسم، أو تدفق العمل |
قد لا تعني هذه المعلومات شيئا للقارئ العام، لكنها مؤشرات قوية لمن هم داخل المنظمة.
في المجهولية، لا تفكر فقط هل يراها من لا يعرفون، بل كيف تبدو لمن يعرفون.
انتبه أيضا إلى استخراج النص داخل PDF
قد يحتوي PDF على نص داخلي حتى إذا بدا من المظهر كأنه صورة.
في ملفات PDF المعالجة بـOCR، قد يوجد نص للبحث خلف صورة المسح الضوئي.
حتى إذا أجريت التنقيح أو التمويه على الصورة، يبقى الخطر إذا بقي النص الأصلي في نص البحث.
| الحالة | ما يجب فحصه |
|---|---|
| PDF ممسوح ضوئيا | هل يوجد نص OCR؟ |
| PDF منقح | هل يظهر النص الأصلي بالنسخ أو البحث؟ |
| PDF يحتوي صورا | هل بقي نص أو خلفية داخل الصورة؟ |
| PDF بحواش | هل يمكن استخراج نص الحواشي أو التعليقات؟ |
| PDF بنماذج | هل بقيت الحقول أو حالات الاختيار؟ |
قبل نشر PDF، لا تقرأه من المظهر فقط، بل افحص البحث والنسخ والبيانات الوصفية.
"لا يظهر على الشاشة" ليس دليلا على السلامة.
أدوات يمكن استخدامها للفحص
إذا أجريت فحص PDF أو تحويله أو تنقيحه أو حذف بياناته الوصفية عبر خدمة على الإنترنت، فقد تنتقل إلى الخدمة نسخة الملف الأصلي، واسم الملف، والمعلومات الداخلية، ومعلومات مصدر الوصول. في المستندات عالية الخطر، لا ترفعها إلى خدمات خارجية؛ افحصها في بيئة محلية، ثم أعد الفحص بطريقة أخرى بعد المعالجة.
قد يُستخدم ExifTool لفحص البيانات الوصفية في PDF.
ويعد qpdf أيضا مرشحا لفحص بنية PDF أو تحويله. qpdf أداة تُستخدم لفحص بنية ملفات PDF وتحويلها، ويمكنك مراجعة طريقة استخدامها في الوثائق الرسمية.
URL: https://qpdf.readthedocs.io/
لكن استخدام أداة لا يجعل الملف آمنا تلقائيا.
يجب قراءة المعلومات المعروضة، ثم إعادة الفحص بعد الحذف أو إعادة الإنشاء.
فحص ما قبل النشر
قبل نشر PDF، افحص بالترتيب الآتي.
| الترتيب | ما يجب فحصه | السبب |
|---|---|---|
| 1 | افحص المنشئ ووقت الإنشاء | لمعرفة هل يرتبطان بالشخص أو وقت العمل |
| 2 | افحص الحواشي والتعليقات | لمعرفة هل بقي مسار التحرير أو الأطراف المعنيون |
| 3 | افحص مواضع التنقيح | لمعرفة هل بقي النص تحتها |
| 4 | افحص الملفات المضمنة والصور | لمعرفة هل بقيت بيانات أصلية أو ملفات أخرى |
| 5 | افحص اسم الملف | لمعرفة هل بقي اسم أو قسم أو اسم قضية |
| 6 | أعد الفحص بعد الحذف | للتأكد من نجاح المعالجة |
PDF صيغة يسهل نسخها بعد النشر.
الفحص قبل النشر مهم.
قرار عدم نشر PDF
في ملفات PDF عالية الخطر، قد لا يكفي الحذف أو التحويل.
قد يضيق محتوى المادة نفسه مصدر المعلومات.
مثلا، إذا بقي تسلسل زمني لا يعرفه إلا المشاركون في اجتماع معين، أو اختصار لا يستخدمه إلا قسم محدد، أو صياغة تختلف بحسب جهة التوزيع، فإن المرشحين يضيقون حتى بعد حذف البيانات الوصفية.
في هذه الحالة، تحتاج إلى قرار مثل عدم نشر PDF كما هو، أو تلخيص المحتوى، أو تعميم أسماء العلم، أو عرض القدر الضروري فقط على جهة استشارة موثوقة، أو حمله إلى خبير أو جهة دعم.
في المجهولية، تنظيف الملف يختلف عن جواز نشره.
الخلاصة
يبدو PDF آمنا لأن مظهره ثابت، لكن داخله قد يحتفظ بالمنشئ، ووقت الإنشاء، والحواشي، والتضمينات، والنص المخفي.
مجرد تحويل الملف إلى PDF لا يكمل المجهولية.
انتبه خصوصا إلى التنقيح، والحواشي، ومعلومات المنظمة، وأرقام التوزيع، وأسماء الملفات.
تساعد أدوات مثل ExifTool وqpdf في الفحص، لكن اسم الأداة وحده لا يحدد السلامة.
قبل النشر، اجمع بين فحص المظهر، والمعلومات الداخلية، واسم الملف، وإعادة الفحص بعد الحذف.
أدوات ذات صلة
ExifTool
مورد خارجي مرتبط بهذه المقالة. افتحه فقط إذا كان مناسبًا لوضعك ولنموذج التهديد لديك.
سبب إدراجه هنا: قد يساعد في موضوع المقالة، لكنه خارج Anonymity Sense وينبغي التحقق منه قبل استخدامه.
URL : https://exiftool.org/
MAT2
مورد خارجي مرتبط بهذه المقالة. افتحه فقط إذا كان مناسبًا لوضعك ولنموذج التهديد لديك.
سبب إدراجه هنا: قد يساعد في موضوع المقالة، لكنه خارج Anonymity Sense وينبغي التحقق منه قبل استخدامه.
qpdf
مورد خارجي مرتبط بهذه المقالة. افتحه فقط إذا كان مناسبًا لوضعك ولنموذج التهديد لديك.
سبب إدراجه هنا: قد يساعد في موضوع المقالة، لكنه خارج Anonymity Sense وينبغي التحقق منه قبل استخدامه.