Sådan fjerner du dublerede linjer fra en tekstfil i Windows - Guide til PowerShell, Notepad++ og Python

Hvordan fjerner man dublerede linjer fra en tekstfil i Windows, svarende til kommandoen "cat file.txt | sort | uniq" i Linux?

For at fjerne dublerede linjer fra en tekstfil i Windows kan du bruge PowerShell, Notepad++ eller et Python-script.

Sådan fjerner du dublerede linjer fra en tekstfil i Windows

Hvis du ønsker at fjerne dublerede linjer fra en tekstfil i Windows, svarende til kommandoen "cat file.txt | sort | uniq" i Linux, kan du følge disse trin:

  1. Brug PowerShell:
    • Åbn PowerShell ved at søge efter "PowerShell" i Start-menuen og vælge "Windows PowerShell".
    • Brug følgende kommando til at fjerne dublerede linjer fra en tekstfil:
      Get-Content file.txt | Sort-Object | Get-Unique | Set-Content output.txt
      • Get-Content file.txt: Læser indholdet af filen file.txt.
      • Sort-Object: Sorterer linjerne alfabetisk.
      • Get-Unique: Fjerner dublerede linjer.
      • Set-Content output.txt: Skriver det unikke indhold til output.txt.
  2. Brug Notepad++:
    • Download og installer Notepad++ fra den officielle hjemmeside.
    • Åbn tekstfilen i Notepad++.
    • Gå til menuen Plugins > Plugin Manager > Show Plugin Manager.
    • Installer plugin'et TextFX (hvis det ikke allerede er installeret).
    • Gå til menuen TextFX > TextFX Tools og vælg Sort lines case sensitive (at column).
    • Gå igen til TextFX > TextFX Tools og vælg Delete Duplicate Lines.
    • Gem filen.
  3. Brug Python Script:
    • Installer Python fra den officielle hjemmeside, hvis det ikke allerede er installeret.
    • Opret en ny fil, f.eks. remove_duplicates.py, og indsæt følgende kode:
      with open('file.txt', 'r') as file:
          lines = file.readlines()
      
      unique_lines = sorted(set(lines))
      
      with open('output.txt', 'w') as file:
          file.writelines(unique_lines)
              
    • Kør scriptet ved at åbne en kommandoprompt og skrive:
      python remove_duplicates.py

Ved at følge en af disse metoder kan du effektivt fjerne dublerede linjer fra en tekstfil i Windows, svarende til kommandoen "cat file.txt | sort | uniq" i Linux.