Cách tạo tệp CSV
CSV là một định dạng tệp đơn giản được sử dụng để lưu trữ dữ liệu dạng bảng, chẳng hạn như bảng tính hoặc cơ sở dữ liệu. Các tệp ở định dạng CSV có thể được nhập và xuất từ các chương trình lưu trữ dữ liệu trong bảng, chẳng hạn như Microsoft Excel hoặc OpenOffice Calc.
CSV là viết tắt của “các giá trị được phân tách bằng dấu phẩy”. Các trường dữ liệu của nó thường được phân tách hoặc phân tách bằng dấu phẩy.
Dữ liệu bảng tính mẫu
Ví dụ: giả sử bạn có một bảng tính chứa dữ liệu sau.
Tên | Lớp | Ký túc xá | Phòng | Điểm trung bình |
---|---|---|---|---|
Sally Whittaker | 2018 | Nhà McCarren | 312 | 3,75 |
Belinda Jameson | 2017 | Nhà Cushing | 148 | 3.52 |
Jeff Smith | 2018 | Nhà Prescott | 17-D | 3,20 |
Sandy Allen | 2019 | Nhà Oliver | 108 | 3,48 |
Dữ liệu trên có thể được biểu diễn trong một tệp có định dạng CSV như sau:
Sally Whittaker,2018,McCarren House,312,3.75 Belinda Jameson,2017,Cushing House,148,3.52 Jeff Smith,2018,Prescott House,17-D,3.20 Sandy Allen,2019,Oliver House,108,3.48
Ở đây, các trường dữ liệu trong mỗi hàng được phân tách bằng dấu phẩy và các hàng riêng lẻ được phân tách bằng một dòng mới.
Tạo tệp CSV
CSV là một tệp văn bản, vì vậy nó có thể được tạo và chỉnh sửa bằng bất kỳ trình soạn thảo văn bản nào. Tuy nhiên, thường xuyên hơn, tệp CSV được tạo bằng cách xuất (Tệp> Xuất) bảng tính hoặc cơ sở dữ liệu trong chương trình đã tạo ra nó. Nhấp vào liên kết bên dưới để biết các bước tạo tệp CSV trong Notepad, Microsoft Excel, OpenOffice Calc và Google Documents.
- Notepad (hoặc bất kỳ trình soạn thảo văn bản nào)
- Microsoft Excel
- OpenOffice Calc
- Google Tài liệu
Notepad (hoặc bất kỳ trình soạn thảo văn bản nào)
Để tạo tệp CSV bằng trình soạn thảo văn bản, trước tiên hãy chọn trình soạn thảo văn bản yêu thích của bạn, chẳng hạn như Notepad hoặc vim và mở một tệp mới. Sau đó, nhập dữ liệu văn bản mà bạn muốn tệp chứa, phân tách từng giá trị bằng dấu phẩy và mỗi hàng bằng một dòng mới.
Title1,Title2,Title3 one,two,three example1,example2,example3
Lưu tệp này với phần mở rộng .csv. Sau đó, bạn có thể mở tệp bằng Microsoft Excel hoặc chương trình bảng tính khác. Nó sẽ tạo một bảng dữ liệu tương tự như sau:
Title1 | Title2 | Tiêu đề3 |
một | hai | số ba |
ví dụ 1 | example2 | example3 |
Trong tệp CSV bạn đã tạo, các trường dữ liệu riêng lẻ được phân tách bằng dấu phẩy. Nhưng nếu bản thân dữ liệu có dấu phẩy trong đó thì sao?
Nếu các trường dữ liệu trong tệp CSV của bạn chứa dấu phẩy, bạn có thể bảo vệ chúng bằng cách đặt các trường dữ liệu đó trong dấu ngoặc kép (“). Các dấu phẩy là một phần dữ liệu của bạn được giữ tách biệt với dấu phẩy phân định chính các trường.
Ví dụ: giả sử một trong các trường văn bản của chúng tôi là mô tả do người dùng tạo cho phép dấu phẩy trong mô tả. Nếu dữ liệu của chúng tôi trông như thế này:
Chỉ huy | Tiêu đề | Điện thoại | Ghi chú |
Jim Grayson | Quản lý cấp cao | (555)761-2385 | Nói thứ ba, anh ấy quan tâm |
Prescilla Winston | Giám đốc phát triển | (555)218-3981 | nói là sẽ gọi lại vào tuần sau |
Melissa Potter | Trưởng phòng tài khoản | (555)791-3471 | Không quan tâm, đã giới thiệu |
Để giữ lại dấu phẩy trong cột “Ghi chú”, chúng ta có thể đặt các trường đó trong dấu ngoặc kép. Ví dụ:
Lead,Title,Phone,Notes Jim Grayson,Senior Manager,(555)761-2385,"Spoke Tuesday, he's interested" Prescilla Winston,Development Director,(555)218-3981,said to call again next week Melissa Potter,Head of Accounts,(555)791-3471,"Not interested, gave referral"
Như bạn có thể thấy, chỉ những trường chứa dấu phẩy mới được đặt trong dấu ngoặc kép.
Điều tương tự cũng xảy ra đối với các dòng mới có thể là một phần của dữ liệu trường của bạn. Bất kỳ trường nào chứa dòng mới như một phần dữ liệu của nó cần được đặt trong dấu ngoặc kép.
Nếu các trường của bạn chứa dấu ngoặc kép như một phần dữ liệu của chúng, thì dấu ngoặc kép bên trong cần được nhân đôi để chúng có thể được diễn giải một cách chính xác. Ví dụ, với dữ liệu sau:
Người chơi | Chức vụ | Biệt hiệu | Năm hoạt động |
---|---|---|---|
Skippy Peterson | Cơ sở đầu tiên | “Blue Dog”, “The Magician” | 1908-1913 |
Bud Grimsby | Lĩnh vực trung tâm | “The Reaper”, “Longneck” | 1910-1917 |
Vic Crumb | Shortstop | “Fat Vic”, “Icy Hot” | 1911-1912 |
Chúng tôi có thể trình bày nó trong một tệp CSV như sau:
Player Name,Position,Nicknames,Years Active Skippy Peterson,First Base,"""Blue Dog"", ""The Magician""",1908-1913 Bud Grimsby,Center Field,"""The Reaper"", ""Longneck""",1910-1917 Vic Crumb,Shortstop,"""Fat Vic"", ""Icy Hot""",1911-1912
Ở đây, toàn bộ trường dữ liệu được đặt trong dấu ngoặc kép và dấu ngoặc kép bên trong được đặt trước (thoát bởi) một dấu ngoặc kép bổ sung.
Dưới đây là các quy tắc về cách dữ liệu nên được định dạng trong tệp CSV, từ tài liệu của IETF, RFC 4180. Trong các ví dụ này, “CRLF” được sử dụng để đại diện cho một ký tự xuống dòng và một dòng cấp dữ liệu (cùng tạo thành một dòng mới).
- Mỗi bản ghi (hàng dữ liệu) phải nằm trên một dòng riêng biệt, được phân cách bằng dấu ngắt dòng. Ví dụ:
aaa,bbb,ccc CRLF
- Bản ghi cuối cùng trong tệp có thể có hoặc không có dấu ngắt dòng kết thúc. Ví dụ:
aaa,bbb,ccc CRLF zzz,yyy,xxx
- Có thể có một dòng tiêu đề tùy chọn xuất hiện dưới dạng dòng đầu tiên của tệp với định dạng giống như các dòng bản ghi bình thường. Tiêu đề chứa các tên tương ứng với các trường trong tệp. Ngoài ra, nó phải chứa cùng một số trường với các bản ghi trong phần còn lại của tệp. Ví dụ:
field_name,field_name,field_name CRLF aaa,bbb,ccc CRLF zzz,yyy,xxx CRLF
- Trong tiêu đề và mỗi bản ghi, có thể có một hoặc nhiều trường, được phân tách bằng dấu phẩy. Mỗi dòng phải chứa cùng một số trường trong toàn bộ tệp. Dấu cách được coi là một phần của trường và không nên bỏ qua. Trường cuối cùng trong bản ghi không được đặt sau dấu phẩy. Ví dụ:
aaa,bbb,ccc
- Mỗi trường có thể được đặt trong dấu ngoặc kép hoặc không. Nếu các trường không được đặt trong dấu ngoặc kép, thì dấu ngoặc kép có thể không xuất hiện bên trong các trường. Ví dụ:
"aaa","bbb","ccc" CRLF zzz,yyy,xxx
- Các trường chứa dấu ngắt dòng (CRLF), dấu ngoặc kép và dấu phẩy phải được đặt trong dấu ngoặc kép. Ví dụ:
"aaa","b CRLF bb","ccc" CRLF zzz,yyy,xxx
- Nếu dấu ngoặc kép bao quanh các trường, thì một dấu ngoặc kép xuất hiện bên trong một trường phải được thoát ra trước nó bằng một dấu ngoặc kép khác. Ví dụ:
"aaa","b""bb","ccc"
Microsoft Excel
Để tạo tệp CSV bằng Microsoft Excel, hãy khởi chạy Excel, sau đó mở tệp bạn muốn lưu ở định dạng CSV. Ví dụ: dưới đây là dữ liệu có trong trang tính Excel mẫu của chúng tôi:
Bài báo | Trị giá | Đã bán | Lợi nhuận |
---|---|---|---|
Bàn phím | $10,00 | $16,00 | $6,00 |
Màn hình | $80,00 | $120,00 | $40,00 |
Chuột | $5,00 | $7,00 | $2,00 |
Toàn bộ | $48,00 |
Sau khi mở, nhấp vào Tệp và chọn Lưu dưới dạng. Trong Lưu dưới dạng loại, hãy chọn CSV (Phân cách bằng dấu phẩy) hoặc CSV (Phân cách bằng dấu phẩy) (* .csv), tùy thuộc vào phiên bản Microsoft Excel của bạn.
Sau khi lưu tệp, bạn có thể tự do mở tệp trong trình soạn thảo văn bản để xem hoặc chỉnh sửa thủ công. Nội dung của nó giống như sau:
Item,Cost,Sold,Profit Keyboard,$10.00,$16.00,$6.00 Monitor,$80.00,$120.00,$40.00 Mouse,$5.00,$7.00,$2.00 ,,Total,$48.00
Hàng cuối cùng bắt đầu bằng hai dấu phẩy vì hai trường đầu tiên của hàng đó trống trong bảng tính của chúng tôi. Đừng xóa chúng – hai dấu phẩy là bắt buộc để các trường tương ứng từ hàng này sang hàng khác. Chúng không thể được bỏ qua.
OpenOffice Calc
Để tạo tệp CSV bằng OpenOffice Calc, hãy khởi chạy Calc và mở tệp bạn muốn lưu dưới dạng tệp CSV. Ví dụ: bên dưới là dữ liệu có trong bảng tính Calc mẫu của chúng tôi.
Bài báo | Trị giá | Đã bán | Lợi nhuận |
---|---|---|---|
Bàn phím | $10,00 | $16,00 | $6,00 |
Màn hình | $80,00 | $120,00 | $40,00 |
Chuột | $5,00 | $7,00 | $2,00 |
Toàn bộ | $48,00 |
Sau khi mở, nhấp vào Tệp, chọn tùy chọn Lưu dưới dạng và đối với tùy chọn Lưu dưới dạng, hãy chọn Văn bản CSV (.csv) (* .csv).
Nếu bạn mở tệp CSV trong một trình soạn thảo văn bản, chẳng hạn như Notepad, nó sẽ giống như ví dụ bên dưới.
Item,Cost,Sold,Profit Keyboard,$10.00,$16.00,$6.00 Monitor,$80.00,$120.00,$40.00 Mouse,$5.00,$7.00,$2.00 ,,Total,$48.00
Như trong ví dụ Excel của chúng tôi, hai dấu phẩy ở đầu dòng cuối cùng đảm bảo các trường tương ứng từ hàng này sang hàng khác. Đừng loại bỏ chúng!
Google Tài liệu
Mở Google Tài liệu và mở tệp bảng tính bạn muốn lưu dưới dạng tệp CSV. Bấm Tệp, Tải xuống dưới dạng, sau đó chọn CSV (trang tính hiện tại).