Windows教程網 >> Linux系統教程 >> 關於Linux >> 如何快速刪除Linux文件中的重復數據行

如何快速刪除Linux文件中的重復數據行

日期：2017/1/25 10:52:34 編輯：關於Linux

　　Linux系統操作中，如果文件中的數據過多，想要刪除重復數據行是非常麻煩的，查找不方便，那麼有什麼方法能夠快速刪除文件重復數據行呢？下面小編就給大家介紹下如何刪除文件重復數據行，一起來看看吧。

　　一、去掉相鄰重復的數據行

　　代碼如下：

　　$cat data1.txt | uniq

　　輸出：

　　beijing

　　wuhan

　　beijing

　　wuhan

　　二、去掉所有重復的數據行

　　代碼如下：

　　$cat data1.txt | sort | uniq

　　注：

　　只有uniq命令的話，只是把相鄰的重復的數據行去掉。

　　如果先 sort 的話，就會把所有重復的數據行變成相鄰的數據行，再 uniq 的話，就去掉所有重復的數據行了。

　　輸出：

　　beijing

　　wuhan

　　附：data1.txt

　　代碼如下：

　　［root@syy ~］# cat data1.txt

　　beijing

　　wuhan

　　beijing

　　wuhan

　　注：在過濾日志中的IP地址很有用。

　　Linux下刪除大數據文件中部分字段重復的行

　　最近寫的一個數據采集程序生成了一個含有1千多萬行數據的文件，數據由4個字段組成，按照要求需要刪除第二個字段重復的行，找來找去linux下也沒找到合適的工具，sed/gawk等流處理工具只能針對一行一行處理，並無法找到字段重復的行。看來只好自己python一個程序了，突然想起來利用mysql，於是進行乾坤大挪移：

　　1. 利用mysqlimport --local dbname data.txt導入數據到表中，表名要與文件名一致

　　2. 執行下列sql語句（要求唯一的字段為uniqfield）

　　代碼如下：

　　use dbname;

　　alter table tablename add rowid int auto_increment not null;

　　create table t select min（rowid） as rowid from tablename group by uniqfield;

　　create table t2 select tablename .* from tablename，t where tablename.rowid= t.rowid;《/p》《p》drop table tablename;

　　rename table t2 to tablename;

　　上面就是Linux刪除文件重復數據行的方法介紹了，本文介紹了多種情況下刪除文件重復數據行的方法，希望對你有所幫助。

上一頁:Linux下文件I/O操作的相關知識
下一頁:Linux中如何巧妙運用find命令

關於Linux

Windows教程網

Ubuntu安裝ifort編譯器的技巧

　　gcc和ifort編譯

SELinux安全機制有哪些？

　　SELinux一直被認

配置OpenWRT路由的方法詳解

　　OpenWRT是一個嵌

Linux系統查看文件內容的命令有哪些？

　　Linux文件內容查閱

在Linux中如何安裝及配置Zsh

　　Zsh和bash都是能

RedHat下載安裝JDK的方法

　　在RedHat系統中，

Linux系統常見問題解答 Linux教程關於Linux

熱讀排行

Docker容器中的文件導入到主機的操作方法

Linux如何使用sysstat中的命令

如何讓紅旗linux使用無線上網卡聯網更安全

Linux下rz命令使用的實例詳解

CentOS 6.2配置vim開發環境的步驟

Windows XP	Windows 7	Windows 2003	Windows Vista	Windows教程綜合	Linux 系統教程
Windows 10	Windows 8	Windows 2008	Windows NT	Windows Server	電腦軟件教程