مخاطر البيانات الوصفية في PDF
يُستخدم PDF كثيرا كمواد منشورة أو مواد تقديم.
لكن لا يمكن الحكم على PDF من مظهره فقط. حتى إذا لم تكتب الاسم في المتن، قد تبقى داخل الملف أسماء المنشئين، وبرنامج الإنشاء، ووقت الإنشاء، والحواشي، والملفات المضمنة، ومعلومات النماذج.
في المجهولية، لا يكون محتوى PDF وحده مؤشرا، بل بيئة إنشاء PDF وسجل تحريره أيضا.
تنظم هذه المقالة المعلومات التي تميل إلى البقاء في PDF، ونقاط الفحص قبل النشر.
المعلومات التي تبقى في PDF
قد يحتوي PDF على معلومات غير المستند نفسه.
| المعلومة | ما تشير إليه | الخطر في المجهولية |
|---|---|---|
| المنشئ | اسم مستخدم OS أو برنامج المستندات | يظهر اسم شخص أو منظمة |
| وقت الإنشاء | متى أُنشئ | يرتبط بوقت السلوك أو فترة إعداد المادة |
| برنامج الإنشاء | Word، LibreOffice، ماسح ضوئي، إلخ | يصبح مؤشرا على بيئة العمل |
| العنوان | اسم المستند الأصلي أو اسم القضية | يبقى اسم داخلي |
| الحواشي | التعليقات وملاحظات التحرير | تظهر الأطراف المعنية أو عملية القرار |
| الملفات المضمنة | مواد أصلية أو بيانات مرفقة | تختلط معلومات غير لازمة |
يبدو PDF كأنه "نسخة مكتملة".
لكن قد تبقى داخله معلومات عن عملية الإنشاء.
فشل التنقيح
من أخطر ما في PDF فشل التنقيح.
قد يبدو النص مخفيا بمستطيل أسود، بينما تبقى معلومات الحروف في الداخل. قد يمكن استخراج النص الأصلي بالنسخ، أو البحث، أو إزالة الطبقة.
| معالجة شائعة | المشكلة | طريقة التفكير الأقرب إلى السلامة |
|---|---|---|
| وضع شكل أسود فوق النص | يبقى النص الأصلي في الداخل | استخدم وظيفة تنقيح مخصصة |
| التحويل إلى لقطة شاشة فقط | انتبه إلى الجودة والمعلومات المخفية | أعد فحص النطاق الضروري |
| الإخفاء بحاشية | قد يمكن إزالة الحاشية | انسخ وابحث بعد الإخراج |
| حذف صفحات | قد تبقى تضمينات أو سجل | أعد توليده كملف منفصل |
| حذف جزء يدويا | تحدث غفلات | اجعله قائمة فحص |
في المواد عالية الخطر، من الأسلم ألا يُحكم على التنقيح بعين شخص واحد فقط.
في السياقات القانونية أو الصحفية أو الإبلاغ الداخلي، قد يلزم فحص خبير أو جهة استشارة موثوقة.
افصل بين مظهر PDF وداخله
في فحص PDF، افصل بين المظهر والمعلومات الداخلية.
في المظهر توجد المتون، والصور، والجداول، وQR code، وأرقام الصفحات، والخلفيات، والعلامات المائية. وفي الداخل توجد البيانات الوصفية، والحواشي، والملفات المضمنة، والنماذج، والروابط.
| مكان الفحص | المعلومات التي تنظر إليها | السبب |
|---|---|---|
| المظهر | المتن، الصور، الجداول، الخلفية | فحص المعلومات الشخصية المباشرة |
| الروابط | URL، جهات المشاركة، التتبع | تجنب ID شخصي أو URL داخلي |
| البيانات الوصفية | المنشئ، برنامج الإنشاء | عدم كشف بيئة العمل |
| الحواشي | التعليقات، المراجعة | عدم ترك محادثات داخلية |
| التضمين | الملفات المرفقة، النماذج | عدم إدخال بيانات غير لازمة |
يبدو PDF كأنه مطبوع.
لكنه في الواقع ملف رقمي له بنية داخلية.
خطوات الفحص
قبل نشر PDF، الأساس هو ألا تنشر الملف الأصلي مباشرة.
اصنع نسخة نشر، وأبق المعلومات الضرورية فقط.
| الخطوة | ما يجب فحصه |
|---|---|
| 1 | اصنع نسخة نشر لا الملف الأصلي |
| 2 | افحص هل يحتوي اسم الملف على اسم حقيقي أو اسم قضية أو اسم منظمة |
| 3 | افحص خصائص المستند |
| 4 | افحص الحواشي والتعليقات والنماذج والتضمينات |
| 5 | افحص هل يمكن نسخ أو بحث مواضع التنقيح |
| 6 | افتحه من جديد في بيئة أخرى وافحص العرض |
| 7 | بعد الرفع، افحص كيف يظهر للطرف الآخر |
تساعد أدوات مثل ExifTool وqpdf في الفحص.
لكن حتى إذا حذفت البيانات الوصفية بأداة، يجب فحص المعلومات المتبقية في المتن والصور بشكل منفصل. إذا رفعت PDF الأصلي إلى خدمة خارجية لتحويل PDF، أو خدمة تنقيح على الإنترنت، أو خدمة فحص بيانات وصفية على الإنترنت، فقد تنتقل إلى تلك الخدمة محتويات المستند، ومعلومات الوصول، ووقت المعالجة. في ملفات PDF عالية الخطر، اجعل الفحص والتحويل قدر الإمكان في بيئة محلية.
افحص أيضا من ترسل إليه PDF
لا تقتصر مخاطر PDF على داخل الملف.
المكان الذي ترفعه إليه، ومن ترسله إليه، والحساب الذي تشاركه منه، كلها مرتبطة بالمجهولية. إذا شاركته من سحابة شخصية، قد يظهر اسم المالك أو عنوان البريد. وإذا أرسلته بالبريد، يبقى المرسل، والموضوع، والوقت.
| طريقة المشاركة | المعلومات المتبقية | نقطة الانتباه |
|---|---|---|
| رابط سحابي | اسم المالك، سجل المشاركة | لا تشاركه من حساب اسم حقيقي |
| مرفق بريد | المرسل، الموضوع، الوقت | انظر إلى ترابط مسار التواصل |
| موقع نشر | وقت الرفع، الحساب | يرتبط بمحتوى المنشور |
| إرسال دردشة | يبقى على جهاز الطرف الآخر | انتبه إلى لقطات الشاشة وإعادة الإرسال |
| تقديم مجهول | سجلات جهة التقديم، وقت الفحص | انظر إلى موثوقية جهة التقديم |
جعل PDF آمنا لا يعني ترتيب داخله فقط.
بل يشمل مسار المشاركة، والحساب، ووقت الإرسال، وحفظ الطرف الآخر أيضا.
الفصل عن المقالات الأخرى
تتناول هذه المقالة خطر المعلومات المتبقية في PDF.
أما خطوات حذف بيانات PDF الوصفية فعليا فتُتناول في "ملاحظات عند حذف بيانات PDF الوصفية". وعند إنشاء PDF من مستند Office، افحص أيضا معلومات منشئ ملف Office الأصلي وسجل التغييرات فيه.
أي إن المهم ألا تنهي الفحص عند PDF وحده.
| ما تنظر إليه | الفحص الرئيسي |
|---|---|
| PDF نفسه | المنشئ، الحواشي، التضمينات، التنقيح |
| ملف Office الأصلي | سجل التغييرات، التعليقات، اسم الشركة |
| الصور | الخلفية، الانعكاس، النص، |
| مسار المشاركة | اسم المالك، URL، وقت الإرسال |
| جهة الاستشارة | التعامل مع القيمة الإثباتية والسلامة |
PDF في مواقف كثيرة "صيغة سهلة للتقديم".
لهذا السبب تحديدا، يميل الناس في الإبلاغ الداخلي، أو الاستشارة في المدرسة أو العمل، أو تقديم معلومات للصحافة، إلى إرساله كما هو. إذا كانت المجهولية مهمة، فافصل أين تبقى معلومات من صنع PDF، ومن حرره، ومن شاركه، ومن فتحه.
انتبه أيضا إلى PDF الذي تستلمه
لا تقتصر مخاطر PDF على الملفات التي تصنعها بنفسك.
قد تبقى في PDF الذي تستلمه من شخص آخر معلومات المنشئ، ووقت الإنشاء، وبرنامج الإنشاء، والحواشي، والملفات المضمنة. إذا نشرت PDF مستلما في تغطية أو استشارة كما هو، فقد تصنع خطا يعود إلى المزود.
| معلومات PDF المستلم | الخطر |
|---|---|
| المنشئ | يُعرف المزود أو المنظمة |
| وقت الإنشاء | تُعرف فترة إعداد المادة |
| الحواشي | تبقى ملاحظات داخلية |
| التضمين | تختلط مواد أصلية |
| اسم الملف | يظهر اسم قضية أو شخص |
كلما كان PDF مستلما، افحصه من منظور حماية المزود.
تبقى مؤشرات أيضا في PDF الممسوح ضوئيا
لا يمكن القول إن مسح الورق إلى PDF يجعله آمنا.
قد تبقى في PDF الممسوح ضوئيا معلومات اسم الماسح، وبرنامج الإنشاء، ووقت الإنشاء. إضافة إلى ذلك، تبقى على الورق نفسه الأختام، وأرقام الاستلام، والكتابة اليدوية، وآثار الطي، وملاحظات الهوامش، وخصائص آلة النسخ. حتى في PDF صوري بلا معلومات نصية، تخرج مؤشرات من المظهر.
| المؤشر | ما يظهر | نقطة الانتباه |
|---|---|---|
| معلومات الماسح | الجهاز أو البيئة المستخدمة | افحص البيانات الوصفية |
| رقم الاستلام | مادة داخل منظمة | يضيق النطاق عبر نظام الترقيم |
| الكتابة اليدوية | من كتب | قد يعرفها المعارف |
| الختم أو التوقيع | شخص أو منظمة | يصبح معلومات تعريف مباشرة |
| الهوامش وآثار الطي | طريقة التعامل مع الأصل | قد يُستنتج مسار الأصل |
يحمل PDF الممسوح ضوئيا مخاطر المستند الرقمي والورقي معا.
افحص ليس البيانات الوصفية فقط، بل كبّر مظهر الورقة وافحصه.
الخلاصة
لا يمكن الحكم على PDF بأنه آمن من مظهره فقط.
قد تبقى فيه أسماء المنشئين، ووقت الإنشاء، وبرنامج الإنشاء، والحواشي، والملفات المضمنة، ومعلومات النماذج.
والتنقيح لا يكفي فيه المظهر وحده. المعالجة التي تترك النص الأصلي داخليا خطرة.
في المجهولية، افصل بين متن PDF، ومظهره، ومعلوماته الداخلية، واسم الملف، وجهة المشاركة.
في المواد عالية الخطر، فكر أيضا في جهة استشارة أو خبير موثوق، ولا تحكم وحدك.
أدوات ذات صلة
ExifTool
مورد خارجي مرتبط بهذه المقالة. افتحه فقط إذا كان مناسبًا لوضعك ولنموذج التهديد لديك.
سبب إدراجه هنا: قد يساعد في موضوع المقالة، لكنه خارج Anonymity Sense وينبغي التحقق منه قبل استخدامه.
URL : https://exiftool.org/
MAT2
مورد خارجي مرتبط بهذه المقالة. افتحه فقط إذا كان مناسبًا لوضعك ولنموذج التهديد لديك.
سبب إدراجه هنا: قد يساعد في موضوع المقالة، لكنه خارج Anonymity Sense وينبغي التحقق منه قبل استخدامه.
qpdf
مورد خارجي مرتبط بهذه المقالة. افتحه فقط إذا كان مناسبًا لوضعك ولنموذج التهديد لديك.
سبب إدراجه هنا: قد يساعد في موضوع المقالة، لكنه خارج Anonymity Sense وينبغي التحقق منه قبل استخدامه.