ในที่สุดก็ได้ Data Analyst Career track ใบแรก

Tanabut Taksinavongskul
1 min readMay 11, 2020

จากการเรียน Data Analyst with Python Career Track ของ Datacamp ก็ใช้เวลาค่อนข้างเยอะพอสมควร course เรียนจะปูพีื้นฐานให้เลยและเน้นทำจริงใน web-base IDE เลย เราไม่ต้องลงโปรแกรมอะไรเพิ่มเติม

แต่เราต้องหา python environment จริงๆ มาฝึกเองด้วย ที่ง่ายสุดคือต้องลง jupyter notebook จะทำให้เราได้ใช้งานจริงไปด้วยในเรื่องการเริ่มต้นจับข้อมูลจริงมาเล่นเอง หรือใช้ในการทบทวนการเขียน pythonใ

เนื้อหาเน้นเรื่อง process ของ การเริมต้นทำข้อมูลก่อน โดยการนำข้อมูลจากแหล่งต่างๆ จะฝึกให้เราทำจริง พิมพ์ code จริงโดยใช้ python เป็นหลักต้องเรียนรู้ ตั้งแต่การ import data, clean data และ manipulate data เพื่อ พร้อมสำหรับการ Analyst ต่อไป โดยส่วนนี้ก็จะเน้น numpy และ pandas โดยจะ เริ่มEDA: Exploratory Data Analysisการวิเคราะห์ทางสถิติก่อนว่าข้อมูล มีความน่าเชื่อถือ และมีคุณภาพมากพอหรือป่าวควบคู่ไปกับ การ visualization โดย ใช้ library ทั้ง matplotlib และseaborn จนในที่สุด เรามาปรับแต่งจนสามารถดูได้ว่า insight ของข้อมูลคืออะไร ทำ Hypothesis test เพื่อดูว่ามีอะไรที่มีความสัมพันธ์กันอย่างมีนัยสำคัญบ้าง ซึ่งมี case study ให้ทำดูด้วย เช่น

ใครสนใจอยาก code ที่เขียนไป ตามที่ github ได้ครับ : https://github.com/TanabutT/DataAnalystPython

Sunlight in Austin : https://github.com/TanabutT/DataAnalystPython/blob/master/Case%20Study%20-%20Sunlight%20in%20Austin.ipynb

Police Activity :https://github.com/TanabutT/DataAnalystPython/blob/master/Police%20Activity.ipynb

ซึ่งในเรื่อง ของ Police Activity ประโยชจากการวิเคราะห์ข้อมูลสามารถ นำไปวิเคราะห์ขยายผลได้และ นำไปปรับปรุงการ ทำงานของตำรวจใน อเมริกา ให้ดีขึ้นโดยไม่เกิดความเหลื่อมล้ำในการปฏิบัติงาน สองมารตฐานกับประชาชนแต่ละชนชาติได้ด้วย ดำเนินงานโดย standford.edu ติดตามอ่านต่อได้ใน https://openpolicing.stanford.edu/publications/

จบจาก career track นี้ ไป ก็ต้องไปต่อในด้าน model classification จาก machine learning กันต่อไปครับ

--

--

Tanabut Taksinavongskul

Data Journey : Self developing and learning on new technology about AI, automation and data related.