Data memes EP.03
ไปให้สุด แล้วหยุดที่มีม Part 3
หลังจาก 2 ตอนที่แล้วของ Data memes ถือเป็น content ชิลๆแต่ก็ได้เกร็ดความรู้ในฝั่งของ Data Analytics กันแล้ว ในตอนนี้ก็ถึงเวลาแล้วที่เราจะมาดู memes ทางฝั่งของ Data Scientist กันบ้างครับ
***คำเตือนก็เหมือนเช่นเคยนะครับ ขอให้ทุกคนอย่าคิดมากและสนุกกับเนื้อหาแทนนะครับ เพราะmemesส่วนใหญ่เนื้อหาค่อนข้างแรงและออกแนวเสียดสี🙂***
นักสถิติ VS Data Scientist 🤷♂️
เมื่อเราเอานักสถิติมาเปรียบเทียบกับ Data Scientist ในปัจจุบันจะเห็นได้อย่างชัดเจนว่า Data Scientist ค่อนข้างที่จะมีบทบาทมากกว่านักสถิติอย่างมาก เพราะในปัจจุบันผู้คนให้ความสำคัญกับ big data มากขึ้น ประกอบกับ hardware ในปัจจุบันที่มีการพัฒนาจนสามารถวิเคราะห์ข้อมูลเหล่านี้ได้ง่ายยิ่งขึ้น
นั่นเพราะ Data Scientist ก็คือนักสถิติที่มีทักษะในการวิเคราะห์ข้อมูลและการใช้ programming language เข้ามาช่วยเหลือในการวิเคราะห์ข้อมูลทั้งขนาดเล็กและขนาดใหญ่ได้นั้นเอง
แต่นั่นก็ไม่ได้หมายความว่านักสถิติจะถูกแทนที่ด้วย Data Scientist แบบ 100% แต่อย่างใด เนื่องจากนักสถิติส่วนใหญ่เองก็มีจุดเด่นในการวิเคราะห์เชิงสถิติเชิงลึกและเข้าใจเหตุผลการทำงานของ algorithm ทางด้านสถิติมากกว่า
ดังนั้นส่วนตัวผมจึงมองว่าทั้งสองอาชีพนี้ไม่ได้ถูกใครด้อยค่าไปกว่าใคร แต่ทำให้ทั้งสองอาชีพนี้ถูกแบ่งแยกลักษณะงานได้อย่างชัดเจนมากยิ่งขึ้น เช่น ลักษณะงานของ Data Scientist จะเน้นไปที่การสร้างโมเดลคอมพิวเตอร์ที่ช่วยตัดสินใจอย่างอัตโนมัติเพื่อตอบโจทย์หรือวัตถุประสงค์จากข้อมูล แต่นักสถิติเองก็เหมาะกับการทำงานวิจัยเพื่อหา best mathematical model หรือ best algorithm เพื่อแก้ไขปัญหาที่เกิดขึ้นนั่นเอง
วิธีการที่ทำให้ Machine Learning งง!!🍪🐕
ใครที่บอกว่า“การมาของ AI จะทำให้โลกเปลี่ยนแปลงในไม่ช้า” โปรดดูภาพนี้…😂 เพราะนี้เป็นโจทย์ที่ท้าทายอย่างมากสำหรับ Data Scientist หรือคนอื่นๆที่มีส่วนร่วมในการผู้พัฒนาโมเดลเอง(แม้แต่คนยังเดายากเลย🤣) เนื่องจากโมเดลส่วนใหญ่จะวิเคราะห์และจำแนกผลจากลักษณะของข้อมูล เช่น รูปที่มีจุดสีดำขนาดใหญ่และมีสีขาวแทรกเล็กน้อย มีเงาและแสงสะท้อน โมเดลจะคิดว่านั่นคือลูกตา (แต่ในรูปนี้บางรูปมันคือ chocolate chip ชัดๆ 🤦♂️)
ผม import pandas as pd ได้…เท่านี้ก็รู้แล้วใช่มั้ยว่าผมเป็น Data Scientist 💚
Data Scientist หรือคนที่ทำงานในสาย Data เองน่าจะรู้จัก pandas
library เป็นอย่างดี เนื่องจากเป็น library สำหรับการจัดการข้อมูลที่อยู่ในรูปแบบตารางซึ่งเรียกกันว่า (DataFrame) นั่นเอง และผู้ใช้งาน library นี้ส่วนใหญ่ก็จะนำมาย่อตัวแปรด้วยคำสั่ง
import pandas as pd
จนกลายเป็นมีมที่เราเห็นนั่นเอง 🤣 เพราะคนส่วนใหญ่มักจะพิมพ์คำสั่งนี้เป็นคำสั่งแรกในงาน Data Science และเห็นว่าแค่การเรียกใช้ pandas ในการจัดการข้อมูลคือทุกอย่างสำหรับงาน Data Science
แต่จริงๆแล้วนั้นไม่ใช่!! 🙅♂ ️ยังมีอีกหลาย library ที่ใช้สำหรับงาน Data Science ที่จะช่วยให้ทำงานกับข้อมูลได้ง่ายยิ่งขึ้นอีกมากมาย เช่น
numpy
: จัดการการคำนวณทางคณิตศาสตร์ในรูป numpy list หรือ matricessklearn
: สำหรับงาน Machine Learningpytorch/keras
: สำหรับงาน Deep Learningpyspark
: สำหรับการจัดการข้อมูลขนาดใหญ่มาก
และยังมีอีกหลาย library ที่ต้องใช้ขึ้นอยู่กับชนิดของงาน
ปล. ผมและเพื่อนในทีมเคยตั้งชื่อทีมในการแข่ง Shopee Code League 2020 ว่า import pandas as np
เนื่องจากประสบการณ์การแข่งในทีมยังไม่มาก (จึงอาจมีการเขียน code ผิดไปบ้าง เพราะnp
มันคือชื่อย่อ library ของ numpy
) อีกเหตุผลหนึ่งก็เหมือนกับมีมนี้เพราะเป็นคำสั่งแรกที่ทุกคนใช้ในการเขียน Code ในงาน Data Science จริงๆ 😅
ถ้าชอบหรือต้องการสอบถามหรือพูดคุยเพิ่มเติม กดไปที่เพจ ดาต้าไส้แห้ง หรือ LinkedIn ข้างล่างเลยจ้า แล้วเรื่องถัดไปจะเป็นเรื่องอะไรก็ขอให้กดติดตามกันไว้ด้วยนะคร้าบ😍