Data Scientist : สายอาชีพสุดคูล

ผู้เรียบเรียง

ดวงพร อรัญญพงษ์ไพศาล

บรรณารักษ์ชำนาญการ ฝ่ายบริการ

 สำนักหอสมุด มหาวิทยาลัยเกษตรศาสตร์

ปัจจุบันโลกกำลังถูกขับเคลื่อนด้วยเทคโนโลยีดิจิทัลทำให้ข้อมูลจำนวนมหาศาลถูกสร้างขึ้นใหม่ตลอดเวลา โดยข้อมูลจะถูกจัดเก็บไว้บน Cloud ขนาดใหญ่ที่สามารถเรียกใช้งานได้ทุกที่ทุกเวลา ถ้าหากจะนำข้อมูลมหาศาลเหล่านั้นมาเชื่อมโยงและวางกลยุทธ์ให้เหนือกว่าคู่แข่งได้นั้น องค์กรจำเป็นต้องมี Data Scientist หรือผู้เชี่ยวชาญด้านการวิเคราะห์ข้อมูลด้านสถิติ นักพัฒนาซอฟต์แวร์ เพื่อทำหน้าที่วิเคราะห์ข้อมูลขนาดใหญ่ไปจนถึงการนำเสนอข้อมูลที่วิเคราะห์ได้ออกมาในรูปแบบของข้อมูลเชิงลึก และนำไปใช้ประโยชน์ในการตัดสินใจเชิงกลยุทธ์ พัฒนาสินค้าบริการ สามารถตอบคำถาม แก้ไขปัญหา สร้างนวัตกรรมใหม่ๆ รวมถึงคาดการณ์ความเสี่ยงที่อาจเกิดขึ้นในอนาคตได้

Data science ใช้เพื่ออะไร

- ตรวจสอบข้อมูลว่าเกิดอะไรขึ้น โดยการแสดงข้อมูลเป็นภาพ เช่น แผนภูมิวงกลม แผนภูมิแท่ง กราฟเส้น ตาราง 

- ตรวจสอบข้อมูลแบบเจาะลึกเพื่อทำความเข้าใจถึงสาเหตุ โดยใช้เทคนิคต่างๆ เพื่อค้นหารูปแบบที่ไม่ซ้ำกัน

- วิเคราะห์แบบคาดการณ์ โดยใช้ข้อมูลในอดีตเพื่อสร้างการคาดการณ์สิ่งที่อาจเกิดขึ้นในอนาคต

- ให้คำแนะนำ วิเคราะห์ผลกระทบที่อาจเกิดขึ้น และหาแนวทางปฏิบัติที่ดีที่สุด

ความสำคัญของ Data Science

1. ช่วยในการตัดสินใจ ด้วยการใช้โมเดลในการคำนวณผลทำให้สามารถคาดการณ์เหตุการณ์ต่างๆ ที่อาจเกิดขึ้นในอนาคต และสามารถวางแผนรับมือได้อย่างถูกต้อง

2. ช่วยลดงาน เพิ่มประสิทธิภาพในการทำงาน เนื่องจากรูปแบบการทำงานแบบอัตโนมัติทำให้เกิดการประเมินวัดผลได้ดีกว่าและการเก็บข้อมูลมีความถูกต้อง แม่นยำ

3. ช่วยลดความความเสี่ยงและความผิดพลาด โดยการใช้โมเดลในการคำนวณผลจะมีความแม่นยำสูงกว่าการใช้คนคำนวณ

4. ช่วยเพิ่ม Value ให้กับลูกค้า การทำ Data Science ช่วยให้องค์กรเก็บข้อมูลได้มากขึ้น ตัดสินใจดีขึ้น จึงทำให้ส่งมอบ Value ให้กับลูกค้าได้อย่างตรงจุด ผ่านการนำข้อมูลมาสร้างสินค้า/บริการใหม่ หรือพัฒนาประสบการณ์ผู้ใช้

องค์ความรู้ที่จำเป็นสำหรับ Data Scientist

1. Computer Science ความรู้ด้านวิทยาการคอมพิวเตอร์ สามารถใช้เทคนิคและเทคโนโลยีในการทำงาน การจัดเก็บข้อมูล การวางฐานข้อมูล การนำเสนอและแสดงผลข้อมูลได้

2. Math & Statistics ความรู้ด้านคณิตศาสตร์และสถิติ สามารถเลือกใช้แบบจำลองในการวิเคราะห์เพื่อทำความเข้าใจข้อมูลและตีความผลลัพธ์ เพื่อนำสถิติที่รวบรวมต่างๆ มาช่วยในการตัดสินใจทางธุรกิจ 

3. Business / Domain Expertise สามารถเข้าใจจุดประสงค์ ขอบเขต และเป้าหมาย กลยุทธ์ทางการตลาด และสามารถตัดสินใจได้อย่างชาญฉลาด


ที่มา : https://www.shellypalmer.com/data-science/

ทักษะจำเป็นที่ Data Scientist 

  • ทักษะเชิงเทคนิค ควรมีทักษะความรู้ด้านคณิตศาสตร์และสถิติเชิงลึก การเขียนภาษาโปรแกรมต่างๆ การใช้เครื่องมือ หรือ AI ความเข้าใจหลักการทำงานของโปรแกรมฐานข้อมูล การวิเคราะห์ข้อมูลเชิงสถิติต่างๆ การสร้าง Dashboard การสรุปและนำเสนอข้อมูลแบบ Visualization
  • ทักษะด้านธุรกิจและการตลาด ควรมีทักษะด้านธุรกิจและการตลาด สามารถเชื่อมโยงข้อมูล วิเคราะห์ข้อมูล และสร้างโมเดลเพื่อจะให้คำตอบทางธุรกิจ รวมถึงความรู้ความเข้าใจเกี่ยวกับโซเชียลมีเดียเพื่อนำไปใช้พัฒนาธุรกิจให้เกิดประโยชน์สูงสุดได้
  • ทักษะด้านการสื่อสาร ควรมีทักษะการสื่อสารที่ดี สามารถอธิบายกราฟและข้อมูลที่ซับซ้อนออกมาได้กระชับ ชัดเจน เข้าใจง่าย ทำให้บุคคลที่ไม่ได้มีความรู้ด้านข้อมูลที่ลึกซึ้งสามารถเข้าใจได้ง่ายขึ้นเพื่อเป็นประโยชน์ต่อการตัดสินใจในการดำเนินงานและการพัฒนาธุรกิจ

กระบวนการทำงานของ Data Scientist

1. การตั้งคำถามที่น่าสนใจ และนำเอาข้อมูลมาช่วยแก้ปัญหาได้

2. การค้นหาและจัดเก็บข้อมูล

3. การสำรวจข้อมูล หาแบบแผนความเชื่อมโยงระหว่างกัน

4. การสร้างแบบจำลองเพื่อวิเคราะห์ข้อมูล

5. การสื่อสารผลลัพธ์ที่เห็นภาพและเข้าใจง่าย

หน้าที่หลักของ Data Scientist 

1. เก็บรวบรวมข้อมูล และคัดแยกข้อมูลดิบจากแหล่งต่างๆ ที่กระจัดกระจายทั้งแบบออนไลน์หรือออฟไลน์ โดยจัดการข้อมูลให้เป็นระเบียบ สมบูรณ์ ถูกต้อง เพื่อให้สามารถนำไปใช้วิเคราะห์ต่อได้ง่ายขึ้น

2. วิเคราะห์ข้อมูลเพื่อค้นหา และสรุปออกมาเป็นข้อมูลเชิงลึกโดยใช้ทักษะ เทคนิคด้านเครื่องมือทางสถิติเพื่อทำการวิเคราะห์ข้อมูลที่มีอยู่ และทำ Data Visualization โดยสร้างรูปภาพแสดงผลข้อมูลในรูปแบบที่เข้าใจง่าย และสามารถนำไปใช้ในการวางแผนกลยุทธ์ได้อย่างมีประสิทธิภาพ

3. ศึกษาเครื่องมือใหม่ๆ พัฒนาแบบจำลองโมเดลที่เกี่ยวข้องกับการใช้อัลกอริทึม และเทคนิคที่เหมาะสมเพื่อสร้างโมเดลที่สามารถทำนายแนวโน้มในอนาคตตามข้อมูลที่มีอยู่ได้

4. นำโมเดลไปใช้งานจริง และตรวจสอบ ดูแลระบบอย่างต่อเนื่องเพื่อให้โมเดลทำงานได้อย่างถูกต้อง มีประสิทธิภาพ

5. สื่อสารผลลัพธ์ของการวิเคราะห์ข้อมูลให้เข้าใจได้ง่าย และนำเสนอผลลัพธ์ของการวิเคราะห์ข้อมูลเพื่อ พัฒนาและปรับปรุงโมเดลอยู่เสมอ

Data Science Workflow

ที่มา : https://blog.skooldio.com/data-scientist-ultimate-guide/

การนำ Data Science มาประยุกต์ใช้

- Customer Segmentation วิเคราะห์พฤติกรรมลูกค้า พัฒนาแคมเปญทางการตลาด เพื่อจัดกลุ่มลูกค้า ทำให้ทราบว่ากลุ่มไหนสนใจเรื่องอะไร จะได้เสนอสิ่งที่ต้องการได้ตรงจุด

- Direct Marketing การทำการตลาดแบบตัวต่อตัว เพื่อให้ลูกค้าแต่ละคนได้รับในสิ่งที่ต้องการ

- Forecasting วิเคราะห์ความเสี่ยง ตัดสินใจลงทุน การคำนวณค่าต่างๆ ที่จะเกิดขึ้นในอนาคต 

- Recommendation การแนะนำสินค้าต่างๆ ที่สอดคล้องกับพฤติกรรมการใช้งานของแต่ละคน 

- Customer Churn Prediction การรู้ล่วงหน้าว่าลูกค้าคนใดกำลังจะเลิกใช้งาน ทำให้สามารถเข้าไปดำเนินการต่างๆ ได้ในทันที เพื่อเปลี่ยนใจลูกค้า

  ให้ยังใช้งานต่อไป

- Employee Churn Prediction วิเคราะห์ข้อมูลพนักงาน พัฒนาโปรแกรมสวัสดิการ การรู้ล่วงหน้าว่าพนักงานคนใดกำลังจะลาออก ทำให้สามารถ

  เข้าไปดำเนินการต่างๆ ได้ในทันที เพื่อช่วยแก้ไขปัญหาและเปลี่ยนใจพนักงานให้ยังอยากทำงานต่อไป

- Fraud Detection การระบุพฤติกรรมที่มีความเสี่ยงในการทำทุจริต ทำให้สามารถป้องกันความเสียหายได้ทันท่วงที

- Cost Optimisation เพิ่มประสิทธิภาพการผลิต ลดต้นทุน การปรับลดค่าใช้จ่ายต่างๆ หรือโยกย้ายการลงทุนเพื่อให้เกิดประสิทธิภาพสูงสุด 

- SLA Analysis การวิเคราะห์ผลการบริการลูกค้า เพื่อให้รู้ประสิทธิภาพของพนักงานบริการ และความพึงพอใจของลูกค้า

- Sentiment Analysis การวิเคราะห์ความรู้สึกของคน อาจวิเคราะห์จากข้อความ เสียง วีดีโอหรือรูปถ่าย

- Image Recognition การจดจำและระบุวัตถุต่างๆ ในภาพ เพื่อประยุกต์ใช้เป็น Face Recognition 

- A/B Testing การวัดผลว่าสิ่งใดดีกว่ากันได้อย่างชัดเจน เพื่อนำสิ่งที่ดีกว่าไปปรับใช้จริง

- Analytic Dashboard เพื่อแสดงผลการวิเคราะห์ข้อมูลได้ตลอดเวลา

- AI การนำ Machine learning model มาต่อยอดเพื่อทำระบบตอบสนองอัตโนมัติตามที่ต้องการ

           Data Science เป็นศาสตร์ที่เรียกได้ว่ากำลังมาแรงและมีส่วนช่วยพัฒนาธุรกิจให้ขับเคลื่อนไปข้างหน้า เนื่องมาจากการพัฒนาเทคโนโลยีทั้งในโลกแห่งความจริงและโลกเสมือน โดยเฉพาะในบริษัทกลุ่มเทคโนโลยีต่างๆ ที่เก็บข้อมูลเอาไว้จำนวนมหาศาล นอกจากนี้ในแวดวงธุรกิจออนไลน์เองก็นำ Data Science มาช่วยในการพัฒนากลยุทธ์การตลาด ทำให้องค์กรมีข้อมูลชัดเจนเรื่องกลุ่มเป้าหมายและความต้องการของลูกค้า ซึ่งนำไปสู่การสร้างสรรค์คอนเทนต์ที่ดึงดูดลูกค้าได้เพื่อให้องค์กรบรรลุเป้าหมาย 

 แหล่งข้อมูลอ้างอิง

Kaewklaow Robru. (2564). Data Science คืออะไร ทำไมจึงสำคัญกับภาคธุรกิจในยุคดิจิทัล?. 

           สืบค้นจาก https://hocco.co/th/blog/data-science-for-business/

Life at AI GEN. (2565). รู้จักกับ Data Scientist อาชีพที่กำลังมาแรง และเป็นที่ต้องการในโลกของการ

          ทำงานยุคใหม่. สืบค้นจาก https://aigencorp.com/get-to-know-more-about-data-scientist/

Digital Tips. (2565). Data Science (วิทยาการข้อมูล) คืออะไร Data Scientist ทำอะไรได้บ้าง?. 

           สืบค้นจาก https://thedigitaltips.com/blog/data-for-business/data-science/

บริษัท เอสซีบี เทคเอกซ์ จำกัด(2566). Data Science คืออะไร สายงานนี้ต้องทำอะไรบ้าง?. สืบค้นจาก 

          https://scbtechx.io/th/blogs/what-is-data-science/

Life at AI GEN. (2566). รวมข้อมูลที่ต้องรู้เกี่ยวกับอาชีพ Data Scientist ฉบับอัปเดตประจำปี 2024. 

          สืบค้นจาก https://aigencorp.com/data-scientist-in-2024/

Bhumibhat Imsamran. (2566). Data Scientist คือใคร รวมทุกแง่มุมของสายอาชีพ และทักษะที่สำคัญ. 

          สืบค้นจาก https://blog.skooldio.com/data-scientist-ultimate-guide/

Data Wow. (2567). รู้จักกับData Science (วิทยาการข้อมูล) ที่ช่วยขับเคลื่อนธุรกิจให้เติบโตสืบค้นจาก

           https://www.datawow.co.th/blogs/get-to-know-data-science-and-how-is-important-in-business

แหล่งข้อมูลที่เกี่ยวข้อง

Martinez-Plumed, F., & Hernandez-Orallo, J. (2023). Training Data Scientists Through 

          Project-Based Learning. IEEE Revista Iberoamericana de Tecnologias Del 

          Aprendizaje, Tecnologias Del Aprendizaje, IEEE Revista Iberoamericana de, IEEE R. 

          Iberoamericana Tecnologias Aprendizaje, 18(3), 295–304. 

          https://doi.org/10.1109/RITA.2023.3302954

Lee, H. S., Mojica, G. F., Thrasher, E. P., & Baumgartner, P. (2022). Investigating Data Like a 

          Data Scientist: Key Practices and Processes. Statistics Education Research Journal, 

          21(2), 1D. https://doi.org/10.52041/serj.v21i2.41

Ahlemeyer-Stubbe, A. (2020). Discussion of “Experiences with big data: Accounts from a 

          data scientist’s perspective.” Quality Engineering, 32(4), 560–562. 

          https://doi.org/10.1080/08982112.2020.1755689

Ahmad, N., Hamid, A., & Chauhan, P. (2023). Will Data Science Outrun the Data Scientist? 

          Computer, 56(2), 121–128. https://doi.org/10.1109/MC.2022.3226929

Sa’ari, H., Goulding, A., & Sahak, M. D. (2023). Can Academic Librarians as Data Scientists 

          Revolutionise User-Centric E-learning? Proceedings of the European Conference on 

          E-Learning (ECEL), 295–304. https://doi.org/10.34190/ecel.22.1.1580

Vaast, E., & Pinsonneault, A. (2021).When Digital Technologies Enable and Threaten 

          Occupational Identity: The Delicate Balancing Act of Data Scientists. MIS Quarterly, 

          45(3)1087–1112. https://doi.org/10.25300/MISQ/2021/16024

Lee, H. S., Mojica, G. F., Thrasher, E. P., & Baumgartner, P. (2022). Investigating Data Like a 

          Data Scientist: Key Practices and Processes. Statistics Education Research Journal, 

          21(2), 1D. https://doi.org/10.52041/serj.v21i2.41

Robinson, T. J., Giles, R. C., & Rajapakshage, R. U. (2020). Discussion of “Experiences with 

           big data: Accounts from a data scientist’s perspective.” Quality Engineering, 32(4), 

           543–549. https://doi.org/10.1080/08982112.2020.1758333

 Sousa, M. J., Melé, P. M., Pesqueira, A. M., Rocha, Á., Sousa, M., & Noor, S. (2021). Data 

          science strategies leading to the development of data scientists’ skills in 

          organizations. Neural Computing & Applications, 33(21), 14523–14531. 

          https://doi.org/10.1007/s00521-021-06095-3

Bolch, C., & Crippen, K. (2022). Data Scientists’ Epistemic Thinking for Creating and 

          Interpreting Visualizations. Statistics Education Research Journal, 21(2). 

          https://doi.org/10.52041/serj.v21i2.21

ดวงพร อรัญญพงษ์ไพศาล | 27/06/2567 | 25 | share : , ,
แบบประเมิน