Если есть многосточный текстовый файл, который нужно разделить на части - быстро и не вручную, то есть несколько вариантов для этого.

Как разделить текстовый файл построчно

В порядке предпочтения/простоты использования и убывания приоритета:

 

1. С помощью Windows Powershell

Команда в одну строчку:

 

gc file.txt -readcount 1000 | ForEach-Object { $i=0 } { $_ | Out-File "new_file${i}.txt"; $i++}

 

gc - сокращенный вариант команды GetContent (чтение файла);

file.txt - исходный многострочный файл, который нужно разделить на несколько с меньшим количеством строк;

1000 - число строк в каждом файле на выходе;

new_file${i}.txt - маска для имени файлов на выходе, вместо ${i} будет инкремент числа от 0 и далее.

Как разделить текстовый файл построчно

Это самый простой и быстрый вариант, причем Powershell легко справится с большими файлами (2 миллиона строк и более).

Условие: пользователь должен хоть чуть-чуть дружить с командной строкой.

Дальше можно не читать :)

 



  

 

2. С помощью BAT-файла

Создать текстовый файл со следующим содержимым:

Как разделить текстовый файл построчно

Сохранить его с расширением BAT в пустую папку. Скопировать в эту же папку текстовый файл, который необходимо разделить на части, указав его название (см. 3 срочку) и нужное количество строк в финальных результирующих файлах (см. 5 срочку). Сохранить изменения в BAT-файле.

Запустить BAT-файл и дождаться окончания работы.

Чтобы вручную не набирать текст батника, его содержимое:

 

@Echo Off
SetLocal enabledelayedexpansion
Set list=big_text_file.txt
REM ## Количество строк в выходных файлах:
Set str=500

Set Num=%str%& Set File=0
For /F "tokens=* usebackq delims=" %%i In ("%list%") Do (
Set /a Num+=1
If !Num! GEQ %str% (
Set Num=0
Set /a File+=1
Set nFile=0!File!
Set nFile=!nFile:~-2!
Echo %%i>New_File!nFile!.txt
) Else Echo %%i>>New_File!nFile!.txt
)
Pause
Exit

 

 

3. С помощью Windows-приложения

Есть несколько таких программ - как бесплатных, так и платных.

Возможно, позже будут приведены примеры.

 

 

4. С помощью Web-приложения

Есть сайты, которые предлагают различные действия по форматированию и обработке файлов.

Некоторые из них при проверке совсем отказались работать, один отработал вроде бы корректно, но скачивать по-одному 30 текстовых файлов совсем не радовало - разработчики данного сервиса могли бы добавить архивирование пакета файлов в один, чтобы было удобно скачивать результат.

Как разделить текстовый файл построчно

Также при использовании больших файлов - размером 100 Мб и более может быть проблемс с загрузкой - она может оборваться в процессе из-за нестабильного или низкоскоростного интернет-соединения, или у сервера параметр "max_upload_size" установлен на меньшее значение, чем ваш файл.

Еще один минус онлайн-сервисов - не стоит загружать на непонятно чьи сайты свои важные и конфиденциальные файлы. 

 

Комментарии (3)

This comment was minimized by the moderator on the site

а куда должны сохраниться файлы ?

This comment was minimized by the moderator on the site

а куда должны сохраниться файлы ?

В исходную папку (если пробуете вариант №1). Только имя файла надо указать отличное от исходного

This comment was minimized by the moderator on the site

А сколько будет вторым вариантом обрабатываться файл на 20-30 млн строк по времени примерно ?
И как понять что процесс успешно запустился ? У меня прост cmd после запуска висит со строчкой нажать любую кнопку для выхода

Здесь не опубликовано еще ни одного комментария

Оставьте свой комментарий

  1. Опубликовать комментарий как Гость.
0 Значки
Вложения (0 / 3)
Поделитесь своим местоположением

      Как настроить Wi-Fi Router TP-LINK TL-WR941N для Билайн
      Как настроить Wi-Fi Router TP-LINK TL-WR941N для Билайн

      Это третья статья из серии "Как настроить беспроводной роутер". В принципе, не важно, какой у вас провайдер Интернета, т.к. различия в настройке не существенные.  Различными могут быть: фиксированный или динамический IP-адрес; наличие или отсутствие привязки по MAC-адресу; протокол подключения (L2TP, PPTP или др.); адрес подключения




      Как отключить стандартную оболочку в навигаторе EXPLAY PN-355
      Как отключить стандартную оболочку в навигаторе EXPLAY PN-355

      Все автомобильные GPS-навигаторы имеют меню с достаточного размера кнопками на сенсорном экране для выстрого запуска необходимых приложений, в первую очередь - программы для непосредственной навигации. Многие современные навигаторы имеют возможность менять путь к навигационной программе. Поэтому при установке альтернативного ПО есть возможность безболезненно через настройки меню задать временно или...




      Как обновить навигационные БД программ JeppView 3 и Flight Deck 3
      Как обновить навигационные БД программ JeppView 3 и Flight Deck 3

      Есть две замечательные программы для пилотов/штурманов от фирмы Jeppesen - JeppView 3 и FlightDeck 3. Вот только Jeppesen несколько лет назад перестал их поддерживать. Вместо программы JeppView 3 сейчас можно приобрести и установить программу JeppView for Windows (в принципе, она почти как старая версия, ничуть не хуже, даже, наоборот, функционал стал более расширенным). А вместо старой доброй FlightDeck 3...




      Кодовое обозначение аэродрома
      Кодовое обозначение аэродрома

      Кодовое обозначение аэродрома (aerodrome reference code) было придумано для того, чтобы упростить сопоставление многочисленных требований к характеристикам аэродромов в целях обеспечения соответствия ряда аэродромных сооружений, оборудования и средств тем типам самолетов, которые предназначены для эксплуатации на данном аэродроме. Термин "Кодовое обозначения аэродрома" (Aerodrome reference...




      Срок действия баз данных Jeppesen для EFB
      Срок действия баз данных Jeppesen для EFB

      Базы данных Jeppesen используются в EFB в следующих программах: Mobile TC, Mobile TC PRO, Mobile FD и Mobile FD PRO. Все перечисленные приложения могут быть установлены, активированы и использоваться в планшетах iPad и содержат следующие базы данных: TerminalChart (схемы и процедуры аэродромов); Text (текстовая информация – General, ATC, Radio Aids, Entry Requirements и др.) Enroute (маршрутная карта) – только у...




      URL-encoding & ASCII Characters
      URL-encoding & ASCII Characters

      Современные web-технологии поддерживают не только якобы сложные русские тексты (по сравнению с попсовой латиницей), но и всякие китайские и японские иероглифы и другие непонятные загогулины. Но раньше такого счастья не было, и web-разработчикам приходилось использовать специальные комбинации знаков для кодирования специальных символов, таких как вопросительный знак, восклицательный знак,...




      6,5-тысячелетняя  эра Jeppesen!
      6,5-тысячелетняя эра Jeppesen!

      В навигационных программах Jeppesen (Jepp View, eLink for Windows и др.), имеющих базу данных со схемами аэропортов (Terminal Charts), срок действия этой навигационной базы данных задавался с помощью текстового файла charts.ini.



Яндекс.Метрика
Сайт работает на быстром VPS/VDS хостинге от FASTVPS