CloudFlare mỗi ngày nhận một lượng truy cập rất lớn trên toàn cầu. Theo thống kê gần đây có khoảng 60 triệu request mỗi giây. Con số này không phải là quá mới, tuy nhiên trước đó vài tháng hành trình tối ưu để có lượng chịu tải như thế mới bắt đầu và kết quả là cho ra một thư viên mã nguồn mở: trie-hard. Trie-hard đã giúp CloudFlare giảm được thời gian tính toán của CPU, và cuối cùng là giúp cho CloudFlare có thể xử lý được một lượng requests lơn ngày càng tăng dần.
Trong thế giới công nghệ ngày nay, tốc độ là chìa khóa của sự thành công. Tại LinkedIn, nơi hàng tỷ yêu cầu từ người dùng được xử lý mỗi ngày trên nhiều nền tảng khác nhau, các kĩ sư tại Linkedin luôn tìm cách để cải thiện trải nghiệm người dùng. Một trong những yếu tố quan trọng nhất là thời gian tải trang - yếu tố có ảnh hưởng trực tiếp đến sự hài lòng của người dùng và hiệu suất của nền tảng. Để cải thiện trải nghiệm người dùng và giảm thiểu thời gian phản hồi, họ đã tích hợp một giải pháp mã hóa mới vào Rest.li, giúp giảm đáng kể độ trễ và tối ưu hóa việc sử dụng tài nguyên.
Bạn có biết Zendesk, công ty phần mềm CRM hàng đầu, đã giải quyết thách thức lưu trữ dữ liệu khổng lồ như thế nào không? Họ đã chuyển từ DynamoDB sang giải pháp kết hợp MySQL và Amazon S3, giúp tiết kiệm tới 80% chi phí! Bài viết này chia sẻ chi tiết về hành trình tối ưu hóa của Zendesk, từ việc thiết kế pipeline dữ liệu đến triển khai các kỹ thuật nâng cao như Bloom Filter và Count-Min Sketch. Nếu bạn quan tâm đến big data, cloud computing hoặc đang tìm cách tối ưu chi phí cho hệ thống của mình, đây chắc chắn là một case study đáng đọc. Hãy cùng khám phá cách Zendesk đạt được hiệu suất cao với chi phí thấp!
Canva cần một hệ thống để đếm số lượt sử dụng, các lượt đếm này không chỉ là lượt sử dụng các mẫu thiết kế, mà còn bao gồm cả hình ảnh, video, và các loại nội dung khác. Thử tưởng tượng với số lượng người dùng của Canva thì việc đếm này lớn đến mức nào. Cùng tìm hiểu bài toán đằng sau nhé
Có lẽ mục đích thật sự đằng sau đó là muốn chúng ta hiểu về tầm quan trọng của cấu trúc dữ liệu. Thật vậy, rất nhiều ý tưởng, giải pháp được phát minh ra dựa trên chúng. Có thể kể đến là Message queue - một cấu trúc góp mặt trong thiết kế hệ thống phần mềm, nhằm tăng khả năng xử lý và giải quyết nhiều vấn đề phức tạp trong hệ thống phân tán.
Apache Kafka là một nền tảng xử lý luồng dữ liệu phân tán, mã nguồn mở, được xây dựng để xử lý các luồng dữ liệu theo thời gian thực. Kafka ban đầu được phát triển bởi LinkedIn và sau đó trở thành một dự án của Apache Software Foundation. Kafka được thiết kế để quản lý các dữ liệu lớn với khả năng mở rộng cao, tính sẵn sàng cao và độ tin cậy.