For at behandle flere .txt filer med over 30 millioner linjer og 20-40 kolonner uden at bruge Excel, kan du følge disse trin:
Python er et kraftfuldt værktøj til at håndtere store datasæt. Du kan bruge pandas biblioteket til at læse, manipulere og gemme data.
pip install pandas
import pandas as pd
# Læs filen med passende separator
df = pd.read_csv('input.txt', sep=',|\s+', engine='python')
# Fjern kolonner ved at specificere deres navne
df = df.drop(['kolonne1', 'kolonne2'], axis=1)
# Omarranger kolonnerne ved at specificere rækkefølgen
df = df[['kolonne3', 'kolonne4', 'kolonne5']]
# Gem den nye fil
df.to_csv('output.txt', sep=':', index=False)
Hvis du arbejder i et Unix/Linux miljø, kan du bruge kommandoer som awk
og sed
til at manipulere filerne.
awk '{print $1, $3, $5}' input.txt > temp.txt
awk '{print $3, $1, $2}' temp.txt > rearranged.txt
sed 's/ /:/g' rearranged.txt > output.txt
R er et andet kraftfuldt værktøj til data manipulation. Du kan bruge dplyr
og readr
pakkerne.
install.packages("dplyr")
install.packages("readr")
library(dplyr)
library(readr)
# Læs filen med passende separator
df <- read_delim('input.txt', delim = ',|\\s+', col_names = TRUE)
# Fjern kolonner ved at specificere deres navne
df <- df %>% select(-kolonne1, -kolonne2)
# Omarranger kolonnerne ved at specificere rækkefølgen
df <- df %>% select(kolonne3, kolonne4, kolonne5)
# Gem den nye fil
write_delim(df, 'output.txt', delim = ':')
Ved at følge disse trin kan du effektivt behandle store .txt filer uden at bruge Excel.
Har du store .txt filer, der kræver behandling? Med Handyhand kan du nemt få hjælp til at håndtere dem. Opret din opgave gratis, og modtag bud fra dygtige hjælpere på få minutter. Gør arbejdet lettere og mere effektivt med Handyhand!