ในที่สุดก็ได้ Data Analyst Career track ใบแรก
จากการเรียน Data Analyst with Python Career Track ของ Datacamp ก็ใช้เวลาค่อนข้างเยอะพอสมควร course เรียนจะปูพีื้นฐานให้เลยและเน้นทำจริงใน web-base IDE เลย เราไม่ต้องลงโปรแกรมอะไรเพิ่มเติม
แต่เราต้องหา python environment จริงๆ มาฝึกเองด้วย ที่ง่ายสุดคือต้องลง jupyter notebook จะทำให้เราได้ใช้งานจริงไปด้วยในเรื่องการเริ่มต้นจับข้อมูลจริงมาเล่นเอง หรือใช้ในการทบทวนการเขียน pythonใ
เนื้อหาเน้นเรื่อง process ของ การเริมต้นทำข้อมูลก่อน โดยการนำข้อมูลจากแหล่งต่างๆ จะฝึกให้เราทำจริง พิมพ์ code จริงโดยใช้ python เป็นหลักต้องเรียนรู้ ตั้งแต่การ import data, clean data และ manipulate data เพื่อ พร้อมสำหรับการ Analyst ต่อไป โดยส่วนนี้ก็จะเน้น numpy และ pandas โดยจะ เริ่มEDA: Exploratory Data Analysisการวิเคราะห์ทางสถิติก่อนว่าข้อมูล มีความน่าเชื่อถือ และมีคุณภาพมากพอหรือป่าวควบคู่ไปกับ การ visualization โดย ใช้ library ทั้ง matplotlib และseaborn จนในที่สุด เรามาปรับแต่งจนสามารถดูได้ว่า insight ของข้อมูลคืออะไร ทำ Hypothesis test เพื่อดูว่ามีอะไรที่มีความสัมพันธ์กันอย่างมีนัยสำคัญบ้าง ซึ่งมี case study ให้ทำดูด้วย เช่น
ใครสนใจอยาก code ที่เขียนไป ตามที่ github ได้ครับ : https://github.com/TanabutT/DataAnalystPython
Sunlight in Austin : https://github.com/TanabutT/DataAnalystPython/blob/master/Case%20Study%20-%20Sunlight%20in%20Austin.ipynb
Police Activity :https://github.com/TanabutT/DataAnalystPython/blob/master/Police%20Activity.ipynb
ซึ่งในเรื่อง ของ Police Activity ประโยชจากการวิเคราะห์ข้อมูลสามารถ นำไปวิเคราะห์ขยายผลได้และ นำไปปรับปรุงการ ทำงานของตำรวจใน อเมริกา ให้ดีขึ้นโดยไม่เกิดความเหลื่อมล้ำในการปฏิบัติงาน สองมารตฐานกับประชาชนแต่ละชนชาติได้ด้วย ดำเนินงานโดย standford.edu ติดตามอ่านต่อได้ใน https://openpolicing.stanford.edu/publications/
จบจาก career track นี้ ไป ก็ต้องไปต่อในด้าน model classification จาก machine learning กันต่อไปครับ