Từ excel đến ngôn ngữ truy vấn SQL

Spread the love

Nếu bạn sử dụng Excel tại nơi làm việc, bạn có thể thường phải bực bội với hộp thoại này:

Bạn có thể phải làm việc trên một bảng tính cực kì khó sửa chữa, nơi mà mỗi cú nhấp chuột kéo dài tới 10 giây màn hình đóng băng. Thường thì điều này là do các tập tin lớn hoặc các bảng tính có quá nhiều các công thức. Excel có thể xử lý tới một triệu hàng, nhưng khi bạn đang làm việc với một tập dữ liệu lớn hoặc thực hiện vệc phân tích nặng nề, excel sẽ chậm lại trước khi bạn tới giới hạn số hàng.

Excel có một điểm yếu khác có thể dẫn tới sự kém hiệu quả: cấu trúc của nó quá linh hoạt. Điều này có vẻ lạ – linh hoạt là một trong những lý do nhiều người yêu thích Excel.Tuy nhiên, nếu một ô có thể được thao tác một cách dễ dàng, thì việc kiểm soát toàn bộ bảng tính sẽ khó hơn. Tính linh hoạt của Excel làm cho tính tuân thủ và chính xác trong các tập dữ liệu lớn là gần như không thể. Dù bạn có cảnh giác như thế nào, bạn vẫn có thể bỏ lỡ một cái gì đó.

Tuy nhiên, có một công cụ tốt hơn cho công việc này.

Xin chào SQL

Dữ liệu bạn đang làm việc trên Excel phải đến từ đâu đó. Nơi đó là một cơ sở dữ liệu. Có bao nhiêu lượt truy cập web vào tháng 1? Tỷ lệ bỏ qua kênh thanh toán của chúng tôi cho sản phẩm mà chúng tôi vừa tung ra là gì? Đây là tất cả các truy vấn. Là một người dùng Excel, bạn có thể nghĩ đến cách bạn viết những câu hỏi này dưới dạng công thức nếu được trang bị bộ dữ liệu thích hợp.

Vậy làm thế nào để bạn trực tiếp truy vấn một cơ sở dữ liệu? Trong hầu hết các trường hợp, người ta sử dụng ngôn ngữ truy vấn SQL (viết tắt của Structured Query Language). SQL cho cơ sở dữ liệu biết bạn muốn xem dữ liệu nào và thao tác nó với phép tính. Khi bạn cảm thấy thoải mái hơn với SQL, bạn có thể di chuyển nhiều phân tích của bạn hơn vào SQL cho đến lúc mà Excel không còn là lựa chọn số 1 nữa. Cơ sở dữ liệu SQL có thể xử lý lượng dữ liệu khổng lồ mà không gặp vấn đề về hiệu năng và có cấu trúc có trật tự để bảo vệ tính toàn vẹn của dữ liệu.

Bảng tính, hãy gặp Cơ sở dữ liệu quan hệ

Cơ sở dữ liệu là một bộ sưu tập dữ liệu có tổ chức. Có rất nhiều loại cơ sở dữ liệu khác nhau, nhưng loại cơ sở dữ liệu cụ thể mà SQL có thể giao tiếp được gọi là cơ sở dữ liệu quan hệ. Cũng như một bảng tính Excel bao gồm các bảng tính, một cơ sở dữ liệu quan hệ bao gồm các bảng, như một bảng dưới đây.

Các bảng có các hàng và cột giống như bảng tính, nhưng trong một bảng, bạn không thể tương tác với từng ô riêng lẻ. Lý do là vì cơ sở dữ liệu có cấu trúc cứng nhắc. Các giá trị trong mỗi hàng được gắn với nhau như một đơn vị duy nhất. Mỗi cột phải có một tên duy nhất và chỉ có thể chứa một loại dữ liệu cụ thể.Cấu trúc linh hoạt của Excel có vẻ khá hay, nhưng bởi vì cấu trúc của cơ sở dữ liệu rất nghiêm ngặt, nên dễ bảo vệ tính toàn vẹn của dữ liệu hơn. Nói cách khác, khó xảy ra sự không nhất quán và sai sót hơn. Và điều đó có nghĩa là bạn có thể đặt lòng tin vào dữ liệu của bạn nhiều hơn.

Cách phổ biến nhất để thao tác dữ liệu trong Excel là sử dụng công thức. Công thức bao gồm một hoặc nhiều hàm cho Excel biết phải làm gì với dữ liệu trong một ô. Ví dụ: bạn có thể thêm các giá trị số bằng nhau bằng SUM (A1: A5) hoặc trung bình chúng bằng AVERAGE (A1: A5).

Tương đương trong SQL là một truy vấn. Ví dụ về một truy vấn trong bảng trên:

SELECT player_name,

hometown,

state,

weight

FROM benn.college_football_players

SELECT và FROM là hai câu lệnh SQL cơ bản. Giống như các công thức, các truy vấn bao gồm các hàm chỉ định thao tác dữ liệu. Các câu lệnh SQL cũng có thể chứa các mệnh đề, toán tử, biểu thức và một vài thành phần khác, nhưng chúng ta sẽ không đi sâu vào các chi tiết ở đây. Những gì bạn cần biết là bạn có thể sử dụng SQL để thao tác dữ liệu cũng như bạn có thể làm trong Excel.

Bạn vẫn còn lưỡng lự? Hãy tham khảo bài viết sau để biết 6 lí do bạn nên học SQL nhé.