سوف نأخذ في هذه المقالة أحد الطرق لمعالجة الملف وتحويله من شكل الى اخر (اكسل excel)، وذلك باستخدام محرر النصوص NotePad++ بالاضافة الى طريقة استخدام ال regex في البحث والاستبدال
المثال الذي سوف نعمل عليه به تجد أن هناك حوالي 500 شركة بمعلومات حولها ولكن طريقة العرض عن طريق الأسطر Row Based والأسهل هو تحويلها للاكسل ك Columns Based حتى يتم البحث والفلترة بها بسهولة، فالمهمة هو تحويل ملف في الصورة رقم 1 ملف الاكسل شيت في الصورة رقم 2.
في هذه المقالة سوف نوضح الطريقة لتحويل ذلك الملف، ويمكن اتباع هذه الأليه في التحويل لغيرها من الملفات مع الأخذ بالاعتبار ان بعض الخطوات قد تختلف بناء على بنية الملف المراد تحويله.
سوف يتم استخدام برنامج notepad++ في عمليات التحويل هذه، مع العلم بأنه يوجد برامج بديله له سواء في بيئة ويندوز أو لينوكس أو ماك، وبشكل عام اي برنامج محرر نصوص يتوفر فيه خاصية البحث والاستبدال بواسطة Extended Mode أو Regular Expression Mode فهو مناسب في الأمر.
نقطة أخرى وهو أن برنامج notepad++ لا يتعامل مع الملفات الضخمة بشكل جيد وقد يهنق Crashing البرنامج اثناء فتح اي ملف كبير أو اثناء القيام بخطوات التحويل، لذلك عند تعاملك مع أي ملف كبير يفضل أن تستخدم البرامج المخصصة للعمل مع الملفات الكبيرة مثل EditPad Lite وهو مجاني في ويندوز.
نبدأ الخطوات:
اولاً: دائماً الأفضل اظهار Symbols الموجودة والمخفية في الملف والتي عادة اغلبها يكون في أخر كل سطر لمعرفة نوعية ال New Lines، فبعد أن تقوم بفتح الملف تقوم عن طريق قائمة View ومن ثم اختيار Show all Characters
ويمكنك اخفائها عن طريق إزالة الصح على Show all Characters بعدما تعرف نوعية ال New Line، بعد أن قمت باظهارها، سوف تجد الان الرموز الموجودة في أخر كل سطر مثلاً CRLF أو CR أو LF على حسب طريقة الNew Line المستخدمة في الملف.
لماذا نقوم بمشاهدتها؟
لأنه أحياناً تجد ملفات مستخدم بها أكثر من طريقة New Line في نفس الوقت، وحتى تقوم بعملية التحويل المناسبة عليك أن تعرف نوعية ال New Line المستخدمة، في أخر هذه الملف سوف نضع مثال على ملف أخر به أكثر من New Line مستخدمة بطريقتي ويندوز ولينوكس ونعرف كيف يتم اصلاح ذلك من خلال ال notepad++.
ثانياً: بما أن برنامج الأكسل يستطيع قرائة ملفات CSV واختصاراً Comma Separated Value وهي تعني أن هناك معامل الفاصلة يفصل بين كل معلومة وأخرى، فنحن نحتاج أن نحول الملف لذلك الفورمات.
لذلك سوف نقوم بتحويل كل الأسطر New Lines الى فاصلة، وبالتالي جميع البيانات تكون في سطر واحد وذلك عن طريق عمل Find And Replace من خلال CTRL+F والذهاب للReplace ومن ثم اختيار Extended Mode والذي يسمح البحث من خلال \n,\r,\t وغيرها، وسوف تكون جملة البحث هي \r\n (أي CRLF) ويتم استبدالها بالفاصلة كما في الصورة التالية، وتقوم بعمل Replace All لتغيير كل الأحرف التي طابقت جملة البحث في هذا الملف.
ثالثاً: بعد عملية التحويل سوف تجد أن جميع البيانات هي في سطر واحد، وسوف نستفيد من علامة ==== حتى نفرق بين كل بيانات شركة على حدة ، لذلك سوف نقوم بعمل فصل بهذه العلامة واستبدالها بسطر جديد من خلال البحث عن ==== وتبديلها ب \r\n وعمل Replace All كما في الصورة التالية بعد تطبيق زر التبديل.
وهذا هو الملف ايضاً تم فتحه عن طريق النوت باد بوضع الRight To Left (بعد فتحه بالنوت باد نقوم ب CTRL+SHIFT التي على اليمين)، وايضاً تستطيع عمل ال Right To Left في ال Notepad++