Data memes EP.03

Pasith Thanapatpisarn
2 min readMay 8, 2022

--

ไปให้สุด แล้วหยุดที่มีม Part 3

หลังจาก 2 ตอนที่แล้วของ Data memes ถือเป็น content ชิลๆแต่ก็ได้เกร็ดความรู้ในฝั่งของ Data Analytics กันแล้ว ในตอนนี้ก็ถึงเวลาแล้วที่เราจะมาดู memes ทางฝั่งของ Data Scientist กันบ้างครับ

***คำเตือนก็เหมือนเช่นเคยนะครับ ขอให้ทุกคนอย่าคิดมากและสนุกกับเนื้อหาแทนนะครับ เพราะmemesส่วนใหญ่เนื้อหาค่อนข้างแรงและออกแนวเสียดสี🙂***

นักสถิติ VS Data Scientist 🤷‍♂️

source

เมื่อเราเอานักสถิติมาเปรียบเทียบกับ Data Scientist ในปัจจุบันจะเห็นได้อย่างชัดเจนว่า Data Scientist ค่อนข้างที่จะมีบทบาทมากกว่านักสถิติอย่างมาก เพราะในปัจจุบันผู้คนให้ความสำคัญกับ big data มากขึ้น ประกอบกับ hardware ในปัจจุบันที่มีการพัฒนาจนสามารถวิเคราะห์ข้อมูลเหล่านี้ได้ง่ายยิ่งขึ้น

นั่นเพราะ Data Scientist ก็คือนักสถิติที่มีทักษะในการวิเคราะห์ข้อมูลและการใช้ programming language เข้ามาช่วยเหลือในการวิเคราะห์ข้อมูลทั้งขนาดเล็กและขนาดใหญ่ได้นั้นเอง

แต่นั่นก็ไม่ได้หมายความว่านักสถิติจะถูกแทนที่ด้วย Data Scientist แบบ 100% แต่อย่างใด เนื่องจากนักสถิติส่วนใหญ่เองก็มีจุดเด่นในการวิเคราะห์เชิงสถิติเชิงลึกและเข้าใจเหตุผลการทำงานของ algorithm ทางด้านสถิติมากกว่า

ดังนั้นส่วนตัวผมจึงมองว่าทั้งสองอาชีพนี้ไม่ได้ถูกใครด้อยค่าไปกว่าใคร แต่ทำให้ทั้งสองอาชีพนี้ถูกแบ่งแยกลักษณะงานได้อย่างชัดเจนมากยิ่งขึ้น เช่น ลักษณะงานของ Data Scientist จะเน้นไปที่การสร้างโมเดลคอมพิวเตอร์ที่ช่วยตัดสินใจอย่างอัตโนมัติเพื่อตอบโจทย์หรือวัตถุประสงค์จากข้อมูล แต่นักสถิติเองก็เหมาะกับการทำงานวิจัยเพื่อหา best mathematical model หรือ best algorithm เพื่อแก้ไขปัญหาที่เกิดขึ้นนั่นเอง

วิธีการที่ทำให้ Machine Learning งง!!🍪🐕

source

ใครที่บอกว่า“การมาของ AI จะทำให้โลกเปลี่ยนแปลงในไม่ช้า” โปรดดูภาพนี้…😂 เพราะนี้เป็นโจทย์ที่ท้าทายอย่างมากสำหรับ Data Scientist หรือคนอื่นๆที่มีส่วนร่วมในการผู้พัฒนาโมเดลเอง(แม้แต่คนยังเดายากเลย🤣) เนื่องจากโมเดลส่วนใหญ่จะวิเคราะห์และจำแนกผลจากลักษณะของข้อมูล เช่น รูปที่มีจุดสีดำขนาดใหญ่และมีสีขาวแทรกเล็กน้อย มีเงาและแสงสะท้อน โมเดลจะคิดว่านั่นคือลูกตา (แต่ในรูปนี้บางรูปมันคือ chocolate chip ชัดๆ 🤦‍♂️)

ผม import pandas as pd ได้…เท่านี้ก็รู้แล้วใช่มั้ยว่าผมเป็น Data Scientist 💚

Data Scientist หรือคนที่ทำงานในสาย Data เองน่าจะรู้จัก pandas library เป็นอย่างดี เนื่องจากเป็น library สำหรับการจัดการข้อมูลที่อยู่ในรูปแบบตารางซึ่งเรียกกันว่า (DataFrame) นั่นเอง และผู้ใช้งาน library นี้ส่วนใหญ่ก็จะนำมาย่อตัวแปรด้วยคำสั่ง

import pandas as pd

จนกลายเป็นมีมที่เราเห็นนั่นเอง 🤣 เพราะคนส่วนใหญ่มักจะพิมพ์คำสั่งนี้เป็นคำสั่งแรกในงาน Data Science และเห็นว่าแค่การเรียกใช้ pandas ในการจัดการข้อมูลคือทุกอย่างสำหรับงาน Data Science

แต่จริงๆแล้วนั้นไม่ใช่!! 🙅‍♂ ️ยังมีอีกหลาย library ที่ใช้สำหรับงาน Data Science ที่จะช่วยให้ทำงานกับข้อมูลได้ง่ายยิ่งขึ้นอีกมากมาย เช่น

  • numpy : จัดการการคำนวณทางคณิตศาสตร์ในรูป numpy list หรือ matrices
  • sklearn : สำหรับงาน Machine Learning
  • pytorch/keras : สำหรับงาน Deep Learning
  • pyspark : สำหรับการจัดการข้อมูลขนาดใหญ่มาก

และยังมีอีกหลาย library ที่ต้องใช้ขึ้นอยู่กับชนิดของงาน

ปล. ผมและเพื่อนในทีมเคยตั้งชื่อทีมในการแข่ง Shopee Code League 2020 ว่า import pandas as np เนื่องจากประสบการณ์การแข่งในทีมยังไม่มาก (จึงอาจมีการเขียน code ผิดไปบ้าง เพราะnp มันคือชื่อย่อ library ของ numpy) อีกเหตุผลหนึ่งก็เหมือนกับมีมนี้เพราะเป็นคำสั่งแรกที่ทุกคนใช้ในการเขียน Code ในงาน Data Science จริงๆ 😅

ถ้าชอบหรือต้องการสอบถามหรือพูดคุยเพิ่มเติม กดไปที่เพจ ดาต้าไส้แห้ง หรือ LinkedIn ข้างล่างเลยจ้า แล้วเรื่องถัดไปจะเป็นเรื่องอะไรก็ขอให้กดติดตามกันไว้ด้วยนะคร้าบ😍

--

--

Pasith Thanapatpisarn
Pasith Thanapatpisarn

Written by Pasith Thanapatpisarn

Analyst | Blogger named Data Sci Haeng

No responses yet