วันอังคารที่ 25 สิงหาคม พ.ศ. 2563

วิทยาการข้อมูล(Data science)

วิทยาการข้อมูล หรือ Data Science คือ ศาสตร์ที่เกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง (Actionable knowledge) อย่างเช่น การปรับปรุงผลิตภัณฑ์ กระบวนการดำเนินงาน ประกอบการตัดสินใจทางธุรกิจ การวางแผนการตลาด และทิศทางขององค์กรในอนาคต



โดยหลักการแล้ว Data Science ประกอบขึ้นจากศาสตร์หลักๆ คือ Hacking Skill (สกิลเกี่ยวกับ Computer Programimg, Data Base, Big data Technologies)  Statistic & Math (ทักษะทางคณิตศาสตร์และสถิติศาสตร์)  Substantive Expertise (หรือ Domain Knowledge)  Presentation (ทักษะการนำเสนอข้อมูล) และ Visualization 

Data Science ไม่ใช่ศาสตร์ใหม่ แต่มันคือการนำความรู้เดิมที่มีอยู่มารวมและประยุกต์เข้าด้วยกันจนเกิดเป็นของใหม่ ด้วยลักษณะของข้อมูลขนาดใหญ่ (Big Data) ในโลกปัจจุบัน การเข้ามาของ Internet of Things  หรือ Censor ต่างๆ ตลอดจน Social media ทำให้เกิดเป็นข้อมูลปริมาณมหาศาล และนำมาสู่ Data Science นั่นเอง

ผลลัพธ์ที่ได้จาก Data Science 
- ค้นพบสิ่งที่ไม่เคยรู้มาก่อนจากข้อมูลที่ได้- ได้ Predictive Model เพื่อนำไปปฏิบัติจริง
- สร้าง Data Product ใหม่ๆ ที่จะส่งผลกระทบต่อธุรกิจ- ช่วยให้ฝ่ายธุรกิจมีความมั่นใจและสามารถตัดสินใจได้ดีขึ้น
คนทำงานด้านวิทยาศาสตร์ข้อมูล จะนำข้อมูลที่กระจัดกระจายจากแหล่งต่างๆ มาจัดการและวิเคราะห์ เพื่อใช้ประโยชน์ตามโจทย์หรือวัตถุประสงค์การใช้งาน เช่น สร้าง Predictive Model หรือระบบอัลกอริทึมขึ้นมาประมวลผล เพื่อค้นหาอินไซต์เกี่ยวกับผู้ใช้งาน (user) หรือเก็บข้อมูลเพื่อใช้ประกอบการตัดสินใจขององค์กรบริษัท เป็นต้น และนี่คือผลลัพธ์ที่จะได้จาก Data Science




ยุค5G/6G

                      ยุค5G

"เราเดินมาถึงยุคการสื่อสารในเจนเนอเรชั่นที่ 5 แล้ว" ซึ่งมีเป้าหมายพัฒนาเพื่อตอบโจทย์โลกหมุนเปลี่ยนไป รวมถึงการมาของ Internet of Things อย่างเช่น Smart Home, Smart Infrastructure, Smart City, Smart Car เป็นต้น ตามคอนเซ็ปต์ “Anything that can be connected, will be connected.” หรืออะไรที่สามารถเชื่อมต่อได้ก็จะถูกเชื่อมต่อด้วยระบบอินเทอร์เน็ต แต่เพื่อให้มีประสิทธิภาพการทำงานสูงสุด ต้องการแสดงผลเรียลไทม์จึงจำเป็นต้องมีความรวดเร็วในการรับส่งข้อมูลเช่น การศึกษา, การขนส่ง, การแพทย์ เป็นต้น



ยุค6G

มีการคาดการณ์กันว่า ความเร็วของ 6G จะเร็วกว่า 5G ถึง 8,000 เท่า
ซึ่งให้ความเร็วได้ถึง 8,000 Gigabit ต่อวินาที
ถ้าให้พูดง่ายๆ คือ
เราจะสามารถดาวน์โหลดภาพยนตร์รวมกันยาว 142 ชั่วโมง ได้ภายในเวลา 1 วินาทีเท่านั้น…
ซึ่งด้วยความเร็ว ณ ระดับนี้
จึงทำให้มีการคาดการณ์กันว่า เทคโนโลยี 6G จะถูกนำมาใช้กับ อุปกรณ์ที่เราสามารถสั่งงานได้ผ่านสมองของเรา โดยที่เราไม่ต้องพิมพ์ หรือพูดอีกต่อไป

1.ข้อมูลมีคุณค่า


ยุคของข้อมูลและสารสนเทศ (Information Age)

     ในยุคของข้อมูลสารสนเทศ ข้อมูลสิ่งที่มีความสำคัญอย่างยิ่ง ถูกนำมาใช้ประโยชน์ด้านต่างๆ เช่น ด้านเศรษฐกิจ การศึกษา สาธารณสุข สิ่งแวดล้อม

การจัดเก็บข้อมูลในรูปแบบเดิม ทำให้การนำข้อมูลมาใช้ไม่สะดวก ไม่ทันกาล สูญหายง่าย

     แผนที่กระดาษในรูปแบบเดิม ไม่สามารถแสดงข้อมูลการจราจรที่เป็นปัจจุบัน และไม่สามารถวางแผนการเดินทางได้ แต่ระบบแผนที่นำทาง (Global Positioning System: GPS) นอกจากแสดงสถานที่ต่างๆ แล้ว ยังมีข้อมูลสภาพการจราจร ระยะเวลาเดินทาง ซึ่งมีความแม่นยำ ช่วยประหยัดเวลา

     

การอัพโหลดรูปภาพส่วนตัว การส่งอีเมล์ในแต่ละวัน การโพสต์ข้อความในสื่อสังคมออนไลน์ การส่งต่อข้อความผ่านอุปกรณ์อิเล็กทรอนิกส์ต่างๆ เป็นต้น ซึ่งข้อมูลดิจิทัลเหล่านี้ ผู้ใช้คนอื่นสามารถนำไปใช้ประโยชน์ต่อได้

Big Data

Big Data คือ

Big Data (บิ๊ก ดาต้า) คือ

Big Data คือ ?? | ในยุคปัจจุบันที่โลกและธุรกิจกำลังถูกขับเคลื่อนด้วยข้อมูลจำนวนมหาศาล จนทำให้คำว่า Big Data มีผู้คนสนใจและเป็น Trend ที่กำลังมามาแรงอย่างมาก และเชื่อว่าหลายๆ คนที่ทำงานอยู่ในวงการไอที หรือสายงานอื่นๆก็ตาม ก็คงได้ยินคำว่า Big Data ผ่านหูกันมาบ้างแล้ว เคยเกิดความสงสัยกันบ้างไหมว่า Big data มันคืออะไร วันนี้เราจะมาหาคำตอบกันในรูปแบบที่เข้าใจได้ง่ายๆ กันครับ

Big Data คือ 

บิ๊กดาต้า (Big Data) คือคำนิยามของข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กรของเราไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า Suppliers พฤติกรรมผู้บริโภค Transaction ไฟล์เอกสารต่างๆที่เกี่ยวข้องทั้งหมด รวมไปจนถึง รูปภาพ URLs ลิงค์ต่างๆที่คุณเก็บไว้ ฯลฯ ที่มีปริมาณมากจนกระทั่งซอฟต์แวร์ปกติทั่วไปไม่สามารถรองรับการเก็บข้อมูลหรือประมวลผลได้อย่างเต็มประสิทธิภาพ 

ซึ่งอีกนัยนึง Big Data คือเทคโนโลยีและสถาปัตยกรรมหรือ Platform ไอทีรุ่นใหม่ ซึ่งอาจมาในรูปแบบซอฟต์แวร์ ที่สามารถรองรับการจัดเก็บ การจัดการ กรองเลือกข้อมูล การวิเคราะห์ แสดงผล และการใช้งานข้อมูลที่มีคุณลักษณะดังต่อไปนี้

คุณลักษณะของ Big Data (4V)Big Data คือ

  1. ที่มีปริมาณมาก (Volume) ปัจจัยข้อแรกแน่นอนว่าคำว่า Big Data มีคำว่า “Big” นั่นก็คือข้อมูลที่มีขนาดใหญ่ ซึ่งสามารถเป็นได้ทั้งรูปแบบ Online และ Offline ซึ่งส่วนมากแล้วจะมีปริมาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป
  2. มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ส่งผ่านข้อมูล Update กันอย่างต่อเนื่อง (Real-time) จนทำให้การวิเคราะห์ง่ายๆแบบ Manual เกิดข้อจำกัด หรือไม่สามารถจับรูปแบบหรือทิศทางของข้อมูลได้
  3. หลากหลายประเภทหรือแหล่งที่มา (Variety) หมายถึงรูปแบบของข้อมูลที่แตกต่างกันออกไป ทั้งในรูปแบบ ตัวอักษร วิดีโอ รูปภาพ ไฟล์ต่างๆ ฯลฯ และหลากหลายแหล่งที่มาเช่น Social Network หรือ Platform E- Commerce ต่างๆ
  4. ยังไม่ผ่านการประมวลผล (Veracity) ยังไม่ผ่านการ Process ให้อยู่ในรูปแบบของข้อมูลดิบ (Raw Data) ที่สามารถใช้สร้างประโยชน์ต่อองค์กรได้ 

ซึ่งข้อมูลเหล่านี้ที่มีคุณลักษณะข้างต้นนี้ ในอดีตที่ผ่านมายังไม่มีเครื่องมือมารองรับและจัดการ หรือยังไม่เคยนำมารวมกันเพื่อตั้งโจทย์ที่เป็นประโยชน์กับธุรกิจ ค้นหาผลลัพธ์ และผ่านกระบวนการวิเคราะห์ข้อมูลและดูความสัมพันธ์กันด้วยเครื่องมือที่เหมาะสม เพื่อให้เกิดเป็นข้อมูลที่สามารถใช้งานได้จริง (Information) และเกิดประโยชน์กับธุรกิจ เมื่อบริษัทมีข้อมูลที่พร้อมและมีประโยชน์ ทำให้กระบวนการตัดสินใจของผู้บริหารมีความถูกต้องและแม่นยำมากขึ้น