CÔNG VIỆC HÀNG NGÀY CỦA DATA ANALYST | BONUS sự khác biệt của Data Analyst – Engineer – Scientist

in Công việc on Tháng Mười Một 25, 2022

Hello, hello! Chào mừng mọi người đã đến với channel Hà Viết Blog. Mình tên là Hà và hiện tại mình đang làm Data Analyst ở một công ty công nghệ ở Vancouver, Canada. Channel này được lập ra với tiêu chí chia sẻ những trải nghiệm đi làm của một Data An

Hello, hello! Chào mừng mọi người đã đến với channel Hà Viết Blog. Mình tên là Hà và hiện tại mình đang làm Data Analyst ở một công ty công nghệ ở Vancouver, Canada. Channel này được lập ra với tiêu chí chia sẻ những trải nghiệm đi làm của một Data Analyst cho bạn nào muốn quan tâm ha. Nếu bạn muốn nghe thêm về những chủ đề này, hãy comment ở dưới và cho mình xin ý kiến nhé! Như bạn thấy thì trời Vancouver bắt đầu chuyển hè. Cuối cùng đã chuyển hè! Mấy tuần trước vẫn còn hơi lạnh nhưng bây giờ đã nóng lên nên đó là lí do tại sao mình mặc áo ngắn tay, mà mấy tuần trước lại mặc dài tay. Đó là chuyện ngoài lề

Tuần vừa rồi mình có đưa ra câu hỏi trên Facebook của mình để chưng cầu ý kiến của các bạn xem bạn có muốn nghe thêm chủ đề mỗi ngày làm việc của Data Analyst hay không. Các bạn vote cho chủ đề này cũng khá nhiều. Hôm nay mình sẽ chia sẻ công việc hàng ngày của mình làm Data Analyst nhé! Công việc Data Analyst của mình khá là hybrid và mình sẽ giải thích thêm là vì sao. Trong xuyên suốt cả video này, mình sẽ nói rất nhiều từ tiếng Anh, tại vì mình không biết dịch những từ chuyên môn đó như thế nào ngành data cũng khá là mới nên mình nghĩ có những từ nó được sử dụng nhiều ở Bắc Mỹ, những châu lục khác và kể cả ở VN Cho nên mình sẽ nói nhiều từ tiếng Anh chuyên môn nhé.

Nhưng nếu bạn không hiểu từ nào, hãy comment và mình sẽ cố gắng giải thích nhé! Trước khi đi vào chi tiết, mình muốn chia sẻ một chút về công việc hiện tại của mình. bởi vì mình sẽ sử dụng những ví dụ rất cụ thể. Mình đang làm cho một công ty tên là Unbounce một SaaS company Nó theo mô hình kinh doanh phần mềm dịch vụ. Mỗi tháng, khách hàng sẽ subscribe để sử dụng sản phẩm của bọn mình. Họ trả tiền dựa trên subscription hàng tháng hay mỗi năm của họ. Sản phẩm của công ty mình là về landing page builder. Nói ngắn gọn về landing page builder, khi bạn thấy một quảng cáo nào trên Facebook hay Google chẳng hạn nếu bạn quan tâm, bạn sẽ click vào quảng cáo đó và quảng cáo đó sẽ dẫn bạn đến một trang thì coi như bạn “land on a page”, gọi là landing page bạn hạ cánh vào cái trang đấy.

Landing page nó phải có thông tin phù hợp với bạn. để khuyến khích bạn mua hàng, hay sign up cho cái gì đấy. Bình thường để làm landing page, marketer phải làm việc với web developer và designer Cả quá trình này vừa tốn thời gian, tốn tiền vì có 3 cái đầu mình phải trả lương cho cả 3. Với sản phẩm này, công ty mình giúp marketer tự tạo landing page không cần đến developer và designer. Họ chỉ cần drag & drop để tạo ra landing page rất dễ dàng và đơn giản. Vào tháng 11 vừa rồi, bọn mình có tung ra một feature mới gọi là Smart Traffic. Mình để link ở dưới để bạn đọc thêm về Smart Traffic. Fun fact: đây là sản phẩm sử dụng machine learning đầu tiên trong thị trường landing page builder.

I’m so proud of my company! Trong công việc hàng ngày của mình bây giờ đi vào chi tiết chính này Trong công việc hàng ngày của mình, mình nghĩ nó có 4 phần. Phần 1: BI reporting set up những report hay dashboard để track KPI. Phần 2: Statistical analysis những phân tích chuyên sâu sử dụng xác xuất thống kê nhiều hơn. Phần 3: Kỹ năng giao tiếp, project management xuyên suốt các dự án mình làm, đề cần kỹ năng này. Phần 4 lý do tại sao mình thấy vị trí của mình hybrid và khá dị đó là nhào nặn data ETL process. ETL được viết tắt của Extract Transform Load, mình sẽ nói thêm sau hen. Mỗi khi bọn mình có một feature mới giống như Smart Traffic chẳng hạn.

Việc đầu tiên không phải là xây dựng report xem khách hàng sử dụng feature đó như thế nào. Việc đầu tiên là phải ngồi xuống thảo luận với những người trực tiếp xây dựng ra feature đấy cũng như là những người xây dựng chiến lược marketing để quảng bá sản phẩm để bọn mình cùng nhau hợp tác, đưa ra định nghĩa của “adoption metric”. Adoption metric nói nôm na là khách hàng họ sử dụng sản phẩm của mình như thế nào nếu họ đã sử dụng rồi, họ có quay lại sử dụng tiếp hay không. Sau khi đã có định nghĩa rồi, mình mới ngồi vào xây dựng report để keep track of KPI. Sau khi xây dựng report xong rồi thì baii mình không phải keep track of KPI nữa! Ở Unbounce thì Data Analyst như mình không phải theo dõi KPI hàng ngày.

Mình biết ở các nơi khác, Business Analyst hay Data Analyst có thể làm việc này xem KPI lên xuống như thế nào. và có những recommendation để improve metric chẳng hạn. Nhưng mà ở Unbounce thì không. Những tip mình rút ra được sau khi làm rất nhiều report như thế này, Thứ 1, mỗi khi có feature mới thế này mình sẽ không biết thực sự nó được thiết kế như thế nào, khách hàng sử dụng nó ra sao. Chuyện này rất bình thường. Mình có thể hỏi những người xây dựng sản phẩm về cách sử dụng, các use case đặc biệt cần lưu ý. Hiểu được những điều đó rồi, mình mới có ý tưởng để bước vào phòng họp để nói chuyện và cùng nhau đưa ra adoption metric hợp lý nhất.

Sau khi chốt được adoption metric rồi, phải lưu lại định nghĩa này ở đâu đó. Bởi vì mình biết với những sản phẩm thế này, luôn có sự nâng cấp sau đó. Nên định nghĩa adoption metric có thể thay đổi theo thời gian. Mình lưu lại để mọi người biết được rằng con số trên report có thể thay đổi vì định nghĩa đã thay đổi và nó đã thay đổi ra sao thì mình có record hết vì mình đã lưu lại ở đâu đấy. Không ai phải thắc mắc gì. Điều cuối cùng, là tuyệt chiêu mình rút ra được. Trước khi ngồi vào viết report và set up dashboard tracking như vậy hãy cũng stakeholders vẽ report. Vẽ ở đây đơn giản là cầm cây bút và tờ giấy trắng vẽ ra xem họ mường tượng report đó sẽ nhìn như thế nào và những con số thể hiện điều gì.

Mình nghĩ điều này rất quan trọng, để tranh việc ông nói gà bà nói vịt. họ nghĩ một đằng, mình làm một nẻo cuối cùng ra report sai lại phải làm lại tốn thời gian. Mảng thứ 2 trong công việc DA là statistical analysis những phân tích chuyên sâu nâng cao hơn. Sau khi set up những dashboard track KPI, stakeholders có thể quay lại hỏi mình những câu sâu hơn về customer behavior. Ví dụ như customer retention chẳng hạn. Trong ví dụ này là khách hàng sử dụng Smart Traffic, họ có ở lại với công ty lâu hơn hay không. Là Data Analyst, mình không phân tích luôn, mà nói chuyện với stakeholders để làm rõ câu hỏi và hướng phân tích.

Trong trường hợp này, vì Smart Traffic mới được tung ra vào tháng 11 thôi. cho nên sẽ có 2 nhóm khách hàng sử dụng nó Nhóm đầu là khách hàng mới khi họ bắt đầu đăng kí subscribe vào tháng 11. Họ là newbie, nên có thể chưa quen cách sử dụng hệ thống, sản phẩm của công ty. Nhóm thứ hai là khác hàng cũ đã có sẵn khi sản phẩm được tung ra. Họ là những người đã quen sử dụng sản phẩm của công ty hơn. Cho nên cả hai nhóm này, behavior của họ sẽ khác nhau. Mình phải phân tích riêng. Sau khi làm rõ câu hỏi và hướng đi, mình đã phân tích customer retention sử dụng Kaplan Meier Survival Analysis Nếu bạn nào muốn tìm hiểu thêm về survival analysis, mình có một video nói chuyện về survival analysis đợt vừa rồi và kể thêm cái case study vừa rồi ở Unbounce mình để link ở dưới nha.

Dừng lại một chút, nãy giờ khi mình chia sẻ hai phần việc của mình bạn có thể thấy là giao tiếp và quản lý dự án nó xuyên suốt trong công việc của mình. Ngoài việc nói chuyện với stakeholder, bọn mình cũng có họp hành như bao bạn khác. Data Analyst vẫn phải họp hành bình thường giữa các team, với công ty. Phần cuối cùng của công việc của mình, ngoài giao tiếp và project management là ETL process ETL được viết tắt từ ExtractTransform-Load Nói nôm na là bạn trích dữ liệu từ nhiều nguồn khác nhau Sau đó áp dụng những logic lên dữ liệu đó chuyển đổi dữ liệu, và sau đó đưa dữ liệu vào data warehouse.

Trong những video trước mình có chia sẻ, mình hay sử dụng SQL và Python trong công việc. Thì ngoài sử dụng hai ngôn ngữ này cho reporting và analysis, mình có dùng nó cho ETL nữa. Với định nghĩa về adoption metric chẳng hạn có thể bọn mình nhận ra chưa có tracking cho metric này trong data warehouse dành cho định nghĩa đó, hay logic đó mới chẳng hạn Trong trường hợp đó, mình sẽ đập logic lên data mình đã có sẵn. Bạn có thể nghĩ nôm na là, nếu bạn muốn làm cái bánh mì thịt nguội chẳng hạn Mình có bánh mì, có thịt nguội, rau, dưa muối, tương ớt Mình phải kẹp chúng với nhau thì mới ra ổ bánh mì thịt nguội ngon lành đúng không? ETL cũng vậy mình có data từ nhiều nguồn khác nhau. Có logic mới thì mình ập chúng vô với nhau.

Để mình có tracking cho những logic đấy. Ngoài SQL để viết SELECT statement, mình dùng Python rất nhiều bởi vì thứ nhất là có những logic phức tạp mình không thể viết trên SQL. “Không thể” thì cũng không hẳn mình chỉ nghĩ mình viết trên Python sẽ dễ hơn. Thứ hai là khi có những nguồn data mà chúng không chịu nói chuyện với nhau chẳng hạn Ví dụ bọn mình có những table ở Postgresql và Mysql riêng rẽ bọn nó không nói chuyện với nhau trực tiếp mà mình sẽ bắt bọn nó nói chuyện thông qua python. Lý do nữa là Data Analyst ở team mình phải sử dụng một số infrastructure khác như Airflow và Alembic. để quản lý tần suất load của data , hay định nghĩa của mỗi table và sự tương tác của các table với nhau Phần này của công việc mình làm cho công việc khá là hybrid.

So với Data Analyst hay Business Analyst ở những công ty khác. Bởi vì mình thấy thường họ sẽ có team data engineer giúp họ làm phần này. Mình thấy cái role của mình khá là dị, nhưng mình học được rất nhiều và mình rất thích nó. Bonus xíu nè, trong công ty của mình cũng có team Data Engineer và Data Scientist. Những việc vừa rồi mình kể có thể ngoài kia scientist và engineer sẽ làm. Có thể bạn sẽ thắc mắc scientist và engineer ở công ty mình thì làm cái gì? Data engineer bọn mình xây dựng những infrastructure from scratch từ khi chưa có gì, họ sẽ xây dựng infra đó maintain nó, nâng cấp nó make sure là bọn mình có một hệ thống để load data vào hàng ngày không bị trục trặc gì công ty mình có nhiều dữ liệu, nên việc đó rất quan trọng.

Scientist của công ty mình chuyên sâu về mảng nghiên cứu hơn. làm R&D , xây dựng những sản phẩm machine learning như mình vừa chia sẻ Coi như hôm nay nói khá nhiều về công việc của Data Analyst và một chút sơ sơ về công việc của Data Scientist và Engineer ở công ty của mình. Rút lại là, ở mỗi công ty, tuỳ vào độ trưởng thành, sẽ có các vị trí data khác nhau. Độ trưởng thành về data cũng như nhu cầu lúc đó họ cần gì. Nếu bạn muốn nộp một ví trí data nào đấy ở một công ty, bạn hãy hỏi kỹ xem vị trí bạn làm sẽ làm gì đầu tiên nha. Nhiều khi mình được thuê vào làm Data Scientist, nhưng hoá ra lại làm cái role của engineer.

https://www.youtube.com/watch?v=YLoHQSQtEdQ

https://youtu.be/YLoHQSQtEdQHello, hello! Chào mừng mọi người đã đến với channel Hà Viết Blog. Mình tên là Hà và hiện tại mình đang làm Data Analyst ở một công ty công nghệ ở Vancouver, Canada. Channel này được lập ra với tiêu chí chia sẻ những trải nghiệm đi làm của một Data An

Categories: Công việc