Posts

Showing posts from 2020

Hợp và tan

Image
Cuộc đời này, người ta gặp nhau, làm quen và kết bạn với nhau thường là bởi họ đang cùng hướng đến một mục tiêu, và cùng đồng hành với nhau trên đoạn đường sắp tới. Thời gian trôi qua, mỗi người một thay đổi. Họ có những mục tiêu mới, khác nhau, nên đoạn đường tiếp theo họ không còn cùng nhau nữa.   Vậy mới nói, cuộc sống là chuỗi ngày hợp tan, vào mỗi một quãng thời gian, ta lại thân quen với những người bạn khác nhau.   Sau này, khi có dịp gặp lại, họ vẫn kể nhau nghe về đoạn đường mới của mình, cũng hay nhắc lại những câu chuyện hồi đó, ngày ấy, và lâu lâu lại được nghe những chuyện xưa đến bây giờ mới được kể.   Đó, chính là một vẻ đẹp của cuộc đời này.  

Thái độ khoa học

Hành trình theo đuổi khoa học kỹ thuật, đối với mình, là cực kỳ chông gai. Trải qua nhiều năm, từng nghe qua nhiều lần, nhưng mãi đến bây giờ mình mới hiểu yếu tố quan trọng nhất trong việc theo đuổi một lĩnh vực hay ngành nghề nào đó, chính là thái độ.   Quan trọng nhất, không đồng nghĩa với duy nhất. Một thái độ tốt nếu không đi kèm với khả năng, môi trường, định hướng, động lực,... thì sẽ không đi đến thành công. Tuy nhiên, mình cho rằng thái độ là quan trọng nhất vì nó là yếu tố tiên quyết, là thứ được hình thành đầu tiên khi mình tiếp cận một lĩnh vực hay một môn học mới. Với mình, nếu xem một hành trình là từ 0 -> 10, thì việc có thái độ tốt sẽ giúp bạn tiến lên từ 0 -> 1 (chính là giai đoạn khó khăn nhất). Và từ con số 1 đó, các cánh cửa mới thực sự được mở ra.   Để có thể hiểu được sự quan trọng của thái độ, mình đã trả một cái giá rất đắt. Bản thân mình là một học sinh có thái độ học tập tốt (ở một số môn nhất định), nhưng sau đó đã đánh mất nó rất nhanh khi môi trường t

DBMS: Three-schema architecture and Data independence

Image
Trước hết, cần nhắc lại về 3 trong 4 tính chất quan trọng của một DBMS: 1. Lưu trữ database description (còn gọi là schema) để đạt được tính self-describing (có nghĩa là bản thân DBMS khi được đưa đến cho người dùng thì đã có đầy đủ dữ liệu và mô tả cấu trúc của tập dữ liệu đó, giúp người dùng có cái nhìn toàn diện về tập dữ liệu để có thể dễ dàng sử dụng). 2. Tách biệt program và data, tức data abstraction. Tính chất này bao gồm program-data independence và program-operation independence. Để làm rõ các tính chất này, cùng nhìn lại vấn đề mà các hệ thống cũ đã gặp phải trong quá khứ. Trước đây, thông tin về dữ liệu được lưu trữ ngay trong application program. Và khi cần thay đổi cấu trúc, thông tin dữ liệu thì phải viết lại chương trình. Còn với DBMS, cấu trúc của tập dữ liệu sẽ được lưu trong DBMS catalog, tách biệt hoàn toàn với program. Như vậy thì 2 module program và DBMS sẽ hoạt động độc lập, những thay đổi về data sẽ được thực hiện trên DBMS mà không ảnh hưởng đến p

Database management system: Tổng quan

Image
Data và database: Ngày nay, các chương trình máy tính được tạo ra để phục vụ các công việc của con người mà trước đây đều được làm thủ công, ví dụ như: mua hàng trực tuyến, thanh toán trực tuyến, chuyển khoản ngân hàng, mua vé máy bay, đăng ký môn học,... Có thể nhận thấy, để các chương trình này hoạt động, thì phải cần có dữ liệu. Chẳng hạn như dữ liệu về người mua hàng, món hàng, thông tin vé máy bay, thông tin môn học, thông tin sinh viên, số dư ngân hàng,... Một điều đặc biệt là khi chương trình máy tính thực hiện việc tính toán xong và kết thúc, thì dữ liệu do nó xử lý đều mất theo, trừ khi nó được lưu trữ lại xuống phần cứng để sử dụng lại cho những lần sau. Vì vậy, các dữ liệu trên được lưu trữ dưới các ổ cứng, về mặt logic thì có thể xem data là record chứa các field dữ liệu. Ví dụ record của sinh viên A bao gồm các field tên, ngày sinh, quê quán, khoa, ngành,... Và nơi tập hợp các data đó chính là Database. Thông thường, một cách chặt chẽ hơn, người ta thường thuậ

Data mining - Tổng quan

Image
Ngày nay, với sự phát triển nhanh chóng của các thiết bị lưu trữ và thu thập dữ liệu, thì lượng dữ liệu được sinh ra có thể được xem như nhiều đến mức bùng nổ. Từ rất lâu, các nhà nghiên cứu đã nhận ra dường như các tập dữ liệu này có thể tiết lộ cho chúng ta điều gì đó về bản chất, tính chất của một sự vật, sự việc, hiện tượng hoặc cũng có thể dự báo trước một sự kiện nào đó mà các phương pháp nghiên cứu trước đây chưa thực hiện được. Chính các chuyên gia trong nhiều lĩnh vực khác nhau cũng rất ngạc nhiên về những gì mà Data mining (DM) nói riêng hay AI nói chung có thể làm được. Một số ứng dụng của DM đã và đang được áp dụng có thể kể đến như: chẩn đoán bệnh qua ảnh y khoa, dự đoán giá chứng khoán, dự báo thời tiết, tìm kiếm các khách hàng tiềm năng hay các bài toán đề xuất cho user (hình minh họa đề xuất bài hát trên soundcloud). Nhìn chung, một quá trình khai phá tri thức từ dữ liệu (Knowledge discovery from data - KDD) đầy đủ gồm ba bước chính, mà DM chỉ là một trong

Kỹ thuật cache

Image
Khi sử dụng các thiết bị và chương trình máy tính, chắc chắn ai cũng nghe qua thuật ngữ cache, ví dụ như trong web browser, trong setting của các thiết bị android, hay trong các thông số kỹ thuật của chiêc máy tính của bạn. Vậy cache là gì, và tại sao phải sử dụng cache?   Cache là gì? Về bản chất, cache là một thiết bị lưu trữ dữ liệu, giống với ổ đĩa và RAM máy tính, tuy nhiên cache có kích thước lưu trữ nhỏ hơn, với tốc độ truy xuất, ghi và đọc nhanh hơn (hình 1).   Cache được sử dụng như thế nào? Về cơ bản, cache có thể xem là một kỹ thuật nhằm tăng tốc độ xử lý của toàn hệ thống, hay nói cách khác là giảm độ trễ khi xử lý (latency). Cache có thể được sử dụng ở nhiều nơi, ví dụng như trong các thiết bị phần cứng máy tính, trong web browser, trong database, hay trong ổ đĩa cứng,... Cùng xét một trường hợp đơn giản của cache trong web browser để hiểu cách cache tác động đến toàn hệ thống như thế nào.   Đầu tiên, cần phải hiểu cách làm việc của web browser, một phần trong hệ thống Wor