MS Excel می تواند 1,048,576 ردیف را نمایش دهد. اگرچه ممکن است در استفاده معمولی این عدد واقعاً بزرگ به نظر برسد، سناریوهای زیادی وجود دارد که در آنها کافی نیست.
چه به فایلهای گزارش یا مجموعه دادههای بزرگ نگاه کنید، به راحتی میتوانید با فایلهای CSV با میلیونها ردیف یا فایلهای متنی عظیم روبرو شوید. از آنجایی که برتری داشتن نمی تواند فایل هایی به این بزرگی را پشتیبانی کند، دقیقاً چگونه آنها را باز می کنید؟ بیایید پیدا کنیم.
چرا ویرایشگرهای متن معمولی نمیتوانند فایلهای واقعاً بزرگ را باز کنند؟
یک رایانه دارای گیگابایت فضای ذخیرهسازی است، پس چرا ویرایشگرهای متن نمیتوانند فایلهای بزرگ را باز کنند؟
دو عامل در اینجا نقش دارند. برخی از برنامهها محدودیتهای رمزگذاریشده در میزان نمایش دادهها دارند. مهم نیست رایانه شما چقدر حافظه دارد، آنها فقط از آن استفاده نمی کنند.
مشکل دوم RAM است. بسیاری از ویرایشگرهای متن محدودیت سختی در تعداد ردیف ها ندارند، اما به دلیل محدودیت حافظه نمی توانند فایل های بزرگ را نمایش دهند. آنها کل فایل را در RAM سیستم بارگذاری می کنند، بنابراین اگر این حافظه به اندازه کافی بزرگ نباشد، فرآیند با شکست مواجه می شود.
روش شماره 1: استفاده از ویرایشگرهای رایگان
بهترین راه برای مشاهده فایلهای متنی بسیار بزرگ، استفاده از… یک ویرایشگر متن است. نه هر ویرایشگر متنی، بلکه ابزارهایی برای نوشتن کد. چنین برنامههایی معمولاً میتوانند فایلهای بزرگ را بدون مشکل مدیریت کنند و رایگان هستند.
نمایشگر فایل متنی بزرگ احتمالاً ساده ترین این برنامه ها است. استفاده از آن واقعاً آسان است، سریع کار می کند و منبع بسیار کمی دارد. تنها نقطه ضعف؟ نمی تواند فایل ها را ویرایش کند. اما اگر فقط میخواهید فایلهای CSV بزرگ را مشاهده کنید، این بهترین ابزار برای این کار است.
برای ویرایش فایلهای متنی بزرگ نیز، باید ایمکس را امتحان کنید. در اصل برای سیستمهای یونیکس ساخته شده است، در ویندوز نیز به خوبی کار میکند و میتواند فایلهای بزرگ را مدیریت کند. به طور مشابه، Neovim و متن عالی دو IDE سبک وزن هستند که میتوان از آنها برای باز کردن فایلهای متنی CSV با اندازه گیگابایت استفاده کرد.
اگر تنها چیزی که به دنبال آن هستید جستجوی داده ها از طریق فایل های گزارش بزرگ است، کیلوگرم فقط ابزاری برای شماست. این برنامه بهروزرسانی برنامه محبوب glogg ، به شما امکان میدهد عملیات جستجوی پیچیده را از طریق فایلهای متنی عظیم به راحتی انجام دهید. از آنجایی که فایلهای گزارش تولید شده توسط کامپیوتر اغلب میتوانند میلیونها ردیف داشته باشند، klogg برای کار با چنین اندازههایی بدون مشکل طراحی شده است..
روش شماره 2: تقسیم به چند قسمت
کل مشکل تلاش برای باز کردن فایلهای CSV بزرگ این است که آنها خیلی بزرگ هستند. اما اگر بخواهید اینها را به چندین فایل کوچکتر تقسیم کنید چه می شود؟
این یک راه حل محبوب است، زیرا معمولاً نیازی به یادگیری رابط کاربری یک ویرایشگر متن جدید ندارد. در عوض، میتوانید از یکی از چندین تقسیم کننده CSV که به صورت آنلاین موجود است برای تقسیم فایل بزرگ به تعدادی فایل با قابلیت باز کردن آسان استفاده کنید. سپس می توان به هر یک از این فایل ها به طور معمول دسترسی داشت.
با این حال، این بهترین راه برای انجام این کار نیست. تقسیم یک فایل بزرگ اغلب میتواند منجر به اشتباهات تایپی عجیب یا فایلهایی با پیکربندی نادرست شود. علاوه بر این، باز کردن هر بخش به طور جداگانه از فیلتر کردن کل داده ها به یکباره جلوگیری می کند.
روش شماره 3: وارد کردن به پایگاه داده
فایلهای متنی و csv. که تا چندین گیگابایت گسترش مییابند عموماً مجموعه دادههای بزرگی هستند. پس چرا آنها را به یک پایگاه داده وارد نکنید؟
SQL رایج ترین زبان نشانه گذاری پایگاه داده است که این روزها استفاده می شود. بسیاری از نسخه های SQL در حال استفاده هستند، اما ساده ترین آنها احتمالا MySQL است. و به عنوان شانس، این امکان وجود دارد که تبدیل فایل CSV به جدول MySQL.
این به هیچ وجه سادهترین روش برای رسیدگی به فایلهای CSV بزرگ نیست، بنابراین فقط در صورتی که میخواهید به طور منظم با مجموعه دادههای بزرگ سروکار داشته باشید، این روش را توصیه میکنیم. اگر MySQL خیلی سخت به نظر می رسد، همیشه می توانید فایل های csv. خود را به MS Access وارد کنید.
روش شماره 4: تجزیه و تحلیل با کتابخانه های پایتون
وقتی با یک فایل csv. با میلیونها ردیف داده کار میکنید، بدیهی است که نمیتوانید به صورت دستی آن را درک کنید. احتمالاً می خواهید داده ها را فیلتر کنید و پرس و جوهای خاصی را برای درک روندها اجرا کنید.
پس چرا کد پایتون بنویس این کار را انجام ندهید؟
یک بار دیگر، این کاربرپسندترین روش نیست. در حالی که پایتون سخت ترین زبان برنامه نویسی برای یادگیری نیست ، کدنویسی است، بنابراین ممکن است بهترین روش برای شما نباشد. با این حال، اگر متوجه شدید که مجبور هستید روزانه فایلهای CSV بسیار بزرگ را تجزیه کنید، ممکن است بخواهید کار را با مقداری کد پایتون خودکار کنید را انجام دهید.
روش شماره 5: با ابزارهای برتر
ویرایشگرهای متنی که در روش اول دیدیم، ابزارهای اختصاصی برای پردازش CSV نبودند. آنها ابزارهای همه منظوره ای بودند که می توانستند برای کار با فایل های csv. نیز استفاده شوند.
اما برنامه های تخصصی چطور؟ آیا هیچ برنامه ای وجود ندارد که برای حل این مشکل ایجاد شده باشد؟.
در واقع وجود دارد. برای مثال، CSV Explorer بر اساس همان فرآیندی است که در دو روش گذشته توضیح دادیم (پایگاه داده SQL و کد پایتون) تا برنامه ای ایجاد کند که قادر به مشاهده و ویرایش فایل های CSV با هر اندازه باشد. میتوانید هر کاری را که از ابزار صفحهگسترده انتظار دارید انجام دهید، مانند ایجاد نمودار یا فیلتر کردن دادهها در CSV Explorer.
گزینه دیگر UltraEdit است. برخلاف ابزار قبلی، این نه تنها برای فایلهای csv. بلکه برای هر نوع فایل متنی در نظر گرفته شده است. به راحتی میتواند فایلهای متنی و CSV را در محدوده چند گیگابایت، با رابط کاربری مشابه بسیاری از ویرایشگرهای رایگان که قبلاً در مورد آن صحبت کردیم، مدیریت کند.
تنها ایراد این ابزارها این است که آنها برنامه های ممتاز هستند و برای استفاده از آنها باید مجوز پولی دریافت کنید. همیشه میتوانید نسخههای آزمایشی رایگان آنها را امتحان کنید تا ویژگیهای آنها را بررسی کنید، یا اگر فقط یک بار استفاده میکنید.
بهترین راه برای باز کردن فایلهای متنی و CSV بزرگ چیست؟
در این عصر دادههای بزرگ، دیدن فایلهای متنی با حجم گیگابایت غیرمعمول نیست، که حتی مشاهده آنها با ابزارهای داخلی مانند Notepad یا MS Excel نیز دشوار است. برای اینکه بتوانید چنین فایل های CSV بزرگی را باز کنید، باید یک برنامه شخص ثالث را دانلود کرده و از آن استفاده کنید.
اگر تنها چیزی که میخواهید مشاهده چنین فایلهایی است، نمایشگر فایل متنی بزرگ بهترین انتخاب برای شماست. برای ویرایش واقعی آنها، میتوانید یک ویرایشگر متن غنی از ویژگیها مانند Emacs را امتحان کنید، یا به سراغ یک ابزار برتر مانند CSV Explorer بروید.
تکنیکهایی مانند تقسیم کردن فایل CSV یا وارد کردن آن به پایگاه داده شامل مراحل بسیار زیادی است. اگر متوجه شدید که زیاد با فایلهای متنی بزرگ کار میکنید، بهتر است مجوز پولی یک ابزار ویژه اختصاصی دریافت کنید.
.