Чем открыть текстовый файл большого размера
Приветствую!
В данной статье посмотрим на малоизвестный текстовый редактор с отличным функционалом, от других его отличает отсутствие лишних нагромождений, а так же он способен открывать файлы огромных размеров.
Не многие текстовые редакторы способны открывать и редактировать объёмные текстовые файлы.
Рассмотрим пример редактирования такого лог-файла с помощью редактора TextPad.
Где скачать редактор TextPad?
Скачать его можно на официальном сайте — http://www.textpad.com/download/index.html.
Кстати, этот редактор поддерживается и живёт с конца 90-х годов. Пожалуй, единственный минус — он на английском языке (может где-то есть русификаторы, но я не заморачивался, ибо редактор прост как 5 копеек).
При первом запуске, будет показана подсказка. Чтобы такие подсказки не появлялись при каждом запуске программы, просто снимите галочку (Show tips on startup).
Для отображения номеров строк, зайдите в меню View и нажмите Line Numbers.
Как открыть и редактировать большие текстовые файлы?
Перед началом редактирования файлов, рекомендую сделать их резервные копии.
В данном примере будем редактировать лог-файл access_log, весом 83 МБ.
Допустим, нам нужно выделить 30 строк, которые идут друг за другом и содержат нужные нам ip-адреса, по которым посетители заходили на сайт в определенный день. Строки находятся где-то в середине файла.
Итак, запускаем TextPad и открываем наш файл. Находим нужные нам строки по номеру или по нужной дате, можно воспользоваться командой поиска (F5). Теперь ставим указатель мыши в начало нужной строки, заходим в меню Search и выполняем команду Go To…(Ctrl+G).
В появившемся окошке нужно указать Line(строка), поставить галочку Extend selection и ввести номер строки, до которой нужно выполнить выделение, в нашем случае 81.
Результат:
Получившееся выделение можно стереть или копировать и сохранить в другой файл, в зависимости от Ваших целей.
Как получить список ip-адресов из лог-файла?
Можно сделать список ip-адресов, которые нужно достать из лог-файла, но помимо ip-адресов в лог-файл записывается и другая информация. Давайте очистим и отфильтруем ip-адреса от лишнего.
Для начала нужно определить максимальную длину нужных нам адресов, просто просмотрев файл, а также определить максимальную длину ненужной нам информации.
В нашем случае, самый длинный ip-адрес заканчивается на 16 колонке, можно смело выделять весь файл начиная с 17 колонки. Максимальную длину можно смело указать 600-800.
Теперь нам нужно выбрать режим блокового выделения. Для этого кликаем два раза левой кнопкой мышки на слове Block в самом низу окна редактора.
Ставим указатель после ip-адреса(на 16 колонке) и снова воспользуемся командой Go To…(Ctrl+G). Задаем число, до какой колонны будет выделение, например 800. Теперь выберем выделение колоннами(Column) , не забываем ставить галочку на Extend selection.
Далее, не снимая выделения, пролистаем файл до конца, чтобы узнать на какой строке он заканчивается и проделываем тоже самое, что и раньше. Вызываем команду Go To…(Ctrl+G), выбираем строки (Line), указываем последнюю строку и не забываем ставить галочку на Extend selection.
Результат:
Полученное выделение текста можно удалить.
В файле остались лишние тире, которые можно удалить командой Replace(замена), аналогично «поиску и замены» в других редакторах.
Для того чтобы убрать повторяющиеся ip-адреса, можно применить сортировку. В меню Tools, выбираем Sort…(F9).
В появившемся окошке ставим галочку на Delete duplicate lines(удалять дубликаты строк). Цифры обозначают диапазон(колон), в котором нужно сортировать информацию.
В итоге у нас получился чистый, отсортированный список.
Вот и всё на сегодня.
Если данная статья оказалась вам полезной, то не забывайте оставлять комментарии.
Добавлю, что с помощью редактора можно компоновать .NET-приложения.
Подробнее об этом написано в книге — «Язык программирования C# 2005 и платформа NET 2.0»
С другими фичами редактора можно ознакомиться тут — https://www.textpad.com/products/textpad/features.html