- โครงการ AI แบบโอเพนซอร์สช่วยให้คุณสามารถจำลองความสามารถของแอปพลิเคชันยอดนิยม (แชทบอท การถอดเสียง เครื่องมือค้นหา การสร้างภาพและเสียง) โดยไม่ต้องพึ่งพาโซลูชันแบบปิด
- เครื่องมือต่างๆ เช่น Whisper, AutoGPT, GPT4All, PrivateGPT, Haystack, Stable Diffusion, OpenDevin, Leon หรือ Google AI Edge Gallery ครอบคลุมกรณีการใช้งานหลักๆ ในธุรกิจ
- การผสมผสานองค์ประกอบเหล่านี้เข้ากับการพัฒนาซอฟต์แวร์แบบกำหนดเอง บริการคลาวด์ และความปลอดภัยทางไซเบอร์ ทำให้สามารถสร้างโซลูชัน AI ระดับมืออาชีพและปรับขนาดได้
- การมีพันธมิตรผู้เชี่ยวชาญด้าน AI สำหรับธุรกิจ แอปพลิเคชันที่กำหนดเอง และระบบวิเคราะห์ข้อมูลทางธุรกิจ จะช่วยให้การเปลี่ยนจากต้นแบบไปสู่ผลิตภัณฑ์ที่แข็งแกร่งและแข่งขันได้ง่ายขึ้น

การรวมกันของ แอปพลิเคชันที่กำหนดเอง และปัญญาประดิษฐ์ สิ่งนี้ได้เปิดประตูสู่สิ่งที่ไม่เคยมีใครเห็นมาก่อนเมื่อไม่กี่ปีที่ผ่านมา นั่นคือความสามารถในการโคลน ปรับเปลี่ยน หรือสร้างฟังก์ชันการทำงานของแอปพลิเคชันที่มีประสิทธิภาพโดยใช้โครงการ AI แบบโอเพนซอร์ส ปัจจุบัน คุณไม่จำเป็นต้องเป็นบริษัทข้ามชาติขนาดใหญ่หรือมีซูเปอร์คอมพิวเตอร์เพื่อทดลองใช้เทคโนโลยีเหล่านี้และเปลี่ยนให้เป็นโซลูชันที่ใช้งานได้จริงสำหรับธุรกิจของคุณ
ในบทความนี้ คุณจะได้พบกับคำแนะนำฉบับสมบูรณ์เกี่ยวกับ คัดลอกแอปพลิเคชันที่ขับเคลื่อนด้วย AI อย่างมีความรับผิดชอบเข้าใจคำว่า "การคัดลอก" ในที่นี้ว่าหมายถึงการจำลองความสามารถ กระบวนการทำงาน และผลลัพธ์ ไม่ใช่การละเมิดลิขสิทธิ์ เราจะมาดูโครงการโอเพนซอร์สบางส่วนที่คุณสามารถติดตั้งบนคอมพิวเตอร์หรืออุปกรณ์มือถือของคุณได้ ว่าโครงการเหล่านั้นเหมาะสมกับสภาพแวดล้อมขององค์กรอย่างไร และทีมผู้เชี่ยวชาญในองค์กรจะนำไปใช้งานได้อย่างไร ซอฟต์แวร์ที่ออกแบบเอง, ความปลอดภัยทางไซเบอร์, บริการคลาวด์ AWS และ Azure และ AI สำหรับธุรกิจ สามารถช่วยคุณผสานรวมสิ่งเหล่านี้เข้าด้วยกันอย่างมืออาชีพได้
การ "คัดลอกแอป" ด้วย AI นั้นหมายความว่าอย่างไรกันแน่?
เมื่อเราพูดถึง คัดลอกแอปพลิเคชันด้วยปัญญาประดิษฐ์ เราไม่ได้หมายถึงการดาวน์โหลดโค้ดจากแอปพลิเคชันเชิงพาณิชย์แล้วคัดลอกมาใช้โดยตรง ซึ่งจะเป็นการกระทำที่ผิดกฎหมายและผิดจริยธรรม แนวคิดคือการใช้ประโยชน์จากโครงการโอเพนซอร์สเพื่อ... จำลองพฤติกรรมและประโยชน์ใช้สอย ที่มีอยู่แล้วในตลาด ได้แก่ ผู้ช่วยเสียง โปรแกรมสร้างภาพ เครื่องมือค้นหาภายใน โปรแกรมถอดเสียงอัตโนมัติ เป็นต้น
โครงการแบบเปิดเหล่านี้เปิดโอกาสให้ทุกคนเข้าร่วมได้ โคลน repository ติดตั้ง และปรับแต่งมัน เพื่อตอบสนองความต้องการของพวกเขา จากนั้นทีมพัฒนาสามารถสร้างเลเยอร์ขึ้นมาได้ แอปพลิเคชันที่กำหนดเอง ซึ่งสอดคล้องกับกระบวนการทำงานของบริษัท ข้อกำหนดด้านความปลอดภัย และระบบที่มีอยู่เดิม (ERP, CRM, อินทราเน็ต, ฐานข้อมูล, บริการคลาวด์ AWS และ Azure เป็นต้น)
ด้วยระบบนิเวศโอเพนซอร์ส ทำให้การสร้างต้นแบบทำได้ง่ายขึ้นกว่าเดิม ตัวแทน AI, ผู้ช่วยภายใน หรือเครื่องมือวิเคราะห์ธุรกิจ โดยไม่ต้องจ่ายค่าลิขสิทธิ์เริ่มต้นที่สูงเกินไป อย่างไรก็ตาม คุณต้องรู้วิธีเลือกโครงการที่เหมาะสม กำหนดขนาดโครงสร้างพื้นฐาน และดูแลจัดการส่วนต่างๆ ความปลอดภัยทางไซเบอร์และการปฏิบัติตามกฎระเบียบ ตั้งแต่วันแรก
ในหัวข้อต่อไปนี้ เราจะมาดูกัน 10 โครงการสำคัญ เครื่องมือเหล่านี้ช่วยให้คุณ "คัดลอก" ความสามารถจากแอปพลิเคชัน AI ยอดนิยมได้ เช่น การถอดเสียงอัตโนมัติ แชทบอท การสร้างภาพ เครื่องมือค้นหาสำหรับองค์กร การโคลนเสียง ผู้ช่วยด้านการพัฒนา และอื่นๆ อีกมากมาย โครงการทั้งหมดนี้สามารถพบได้บน GitHub ติดตั้งบนเครื่องของคุณ และที่สำคัญที่สุดคือ สามารถต่อยอดเพิ่มเติมได้ผ่าน [การพัฒนา/โครงการ/อื่นๆ เพิ่มเติม] ซอฟต์แวร์ที่กำหนดเอง.
Whisper by OpenAI: ถอดเสียงจากไฟล์เสียงได้เหมือนแอปที่ดีที่สุด

แอปพลิเคชันยอดนิยมจำนวนมากอาศัยการแปลงเสียงเป็นข้อความที่มีความแม่นยำสูง OpenAI กระซิบ คุณสามารถสร้างสิ่งที่คล้ายคลึงกันมากได้ในโครงสร้างพื้นฐานของคุณเอง นี่คือโมเดลโอเพนซอร์สสำหรับ ถอดเสียงเป็นข้อความ มีให้เลือกหลายภาษา เหมาะสำหรับพอดแคสต์ การประชุม ชั้นเรียน หรือการสนทนากับลูกค้า
โดยทั่วไป การติดตั้ง Whisper จะเกี่ยวข้องกับการใช้ Python และการเรียกใช้งาน pip install openai-whisperหลังจากโคลนที่เก็บข้อมูลอย่างเป็นทางการแล้ว github.com/openai/whisperจากนั้น คุณสามารถผสานรวมเข้ากับเครื่องบันทึกเสียง แพลตฟอร์มการประชุมทางวิดีโอ หรือแอปพลิเคชันภายในที่ทีมของคุณใช้งานอยู่แล้วได้
ในสภาพแวดล้อมทางธุรกิจ Whisper เหมาะอย่างยิ่งสำหรับ สร้างรายงานการประชุมอัตโนมัติถอดเสียงการฝึกอบรมภายในหรือสร้าง คลังข้อมูลการค้นหา ซึ่งสามารถนำไปใช้ประโยชน์ร่วมกับบริการและเครื่องมือด้านธุรกิจอัจฉริยะ เช่น กำลัง BIลองนึกภาพว่าการประชุมผู้บริหารทั้งหมดสามารถจัดทำดัชนีและค้นหาได้โดยใช้ภาษาธรรมชาติ
หัวใจสำคัญของการ "ลอกเลียนแบบ" แอปถอดเสียงเชิงพาณิชย์คือการผสาน Whisper เข้ากับระบบที่ดี แอปพลิเคชันที่กำหนดเองอินเทอร์เฟซที่ใช้งานง่าย การจัดการผู้ใช้ การจัดเก็บไฟล์เสียงและข้อความอย่างปลอดภัย การผสานรวมกับบริการคลาวด์ AWS และ Azure และนโยบายต่างๆ โลกไซเบอร์ ออกแบบมาให้เหมาะกับภาคธุรกิจของคุณ (กฎหมาย การดูแลสุขภาพ การเงิน ฯลฯ)
AutoGPT และเอเจนต์ AI อัตโนมัติเพื่อช่วยในการทำงานต่างๆ
หากเป้าหมายของคุณคือการจำลองแอปพลิเคชันที่วางแผนและดำเนินการงานต่างๆ โดยอัตโนมัติเกือบทั้งหมด GPT อัตโนมัติ นี่เป็นหนึ่งในโครงการหลัก มันคือ... agente autónomo ซึ่งอาศัยโมเดล GPT ในการแบ่งเป้าหมายออกเป็นงานย่อยและดำเนินการตามเป้าหมายเหล่านั้นโดยที่คุณไม่ต้องคอยติดตามแต่ละขั้นตอน
โครงการจะเริ่มต้นที่ github.com/Significant-Gravitas/Auto-GPT และต้องการ Python และ คีย์เอพีไอ เลือกโมเดลภาษาที่คุณต้องการใช้ เมื่อตั้งค่าเสร็จแล้ว คุณสามารถสั่งให้ค้นคว้าหัวข้อ สร้างรายงาน เตรียมกลยุทธ์การตลาดเนื้อหา หรือทำให้การโต้ตอบกับเครื่องมือออนไลน์บางส่วนเป็นไปโดยอัตโนมัติได้
แอปพลิเคชันเพิ่มประสิทธิภาพการทำงานและระบบอัตโนมัติที่ใช้ AI ในปัจจุบันจำนวนมากใช้หลักการเดียวกันนี้: เอージェนต์ AI ซึ่งจะรับเป้าหมายและตัดสินใจเพื่อบรรลุเป้าหมายนั้น ด้วย AutoGPT บริษัทต่างๆ สามารถ ผู้ช่วยภายในต้นแบบ ที่พวกเขารับผิดชอบงานต่างๆ เช่น บทความฉบับร่างสร้างแคมเปญการตลาดทางอีเมล หรือรวบรวมข้อมูลเกี่ยวกับคู่แข่ง
อย่างไรก็ตาม เพื่อให้สารตัวนี้สามารถเปลี่ยนจากการทดลองไปเป็นผลิตภัณฑ์จริงได้ จำเป็นต้องถูกห่อหุ้มด้วยชั้นของ... ซอฟต์แวร์ที่กำหนดเอง ซึ่งกำหนดขอบเขตที่ชัดเจน บันทึกการกระทำ และปฏิบัติตามข้อกำหนดของ โลกไซเบอร์ทีมพัฒนาที่ดีสามารถผสานรวม AutoGPT เข้ากับแดชบอร์ดภายใน เวิร์กโฟลว์ทางธุรกิจ และบริการคลาวด์ AWS และ Azure เพื่อปรับขนาดได้ตามต้องการ
GPT4All และ llama.cpp: แชทบอทแบบโลคอลที่ไม่ต้องพึ่งพาคลาวด์
แอปอีกประเภทหนึ่งที่หลายคนอยาก "ลอกเลียนแบบ" คือ... แชทบอทประเภท ChatGPTแต่ดำเนินการในระดับท้องถิ่นด้วยเหตุผลด้านความเป็นส่วนตัวหรือต้นทุน โครงการสองโครงการที่โดดเด่นในที่นี้ ได้แก่: GPT4 ทั้งหมด y ลามะ.cppซึ่งช่วยให้คุณสามารถใช้งานโมเดลสร้างข้อความอัตโนมัติบนคอมพิวเตอร์หรือเซิร์ฟเวอร์ของคุณเองได้
GPT4 ทั้งหมดพร้อมใช้งานใน github.com/nomic-ai/gpt4allโปรแกรมนี้มีอินเทอร์เฟซกราฟิกที่ใช้งานง่ายมากสำหรับการทำงานกับโมเดล GPT ในเครื่อง เหมาะอย่างยิ่งสำหรับการติดตั้ง ผู้ช่วยภายใน ซึ่งไม่ขึ้นอยู่กับบริการภายนอก ถือเป็นสิ่งที่บริษัทที่จัดการข้อมูลที่เป็นความลับ หรือบริษัทที่ต้องการลดการพึ่งพาระบบคลาวด์ให้ความสำคัญเป็นอย่างมาก
สำหรับส่วนของตน ลามะ.cpp (ตอน github.com/ggerganov/llama.cppโปรแกรมนี้ได้รับการปรับแต่งให้สามารถรันโมเดลตระกูล LLaMA ได้อย่างมีประสิทธิภาพสูงสุดบน CPU แม้แต่ในเครื่องที่มีสเปคไม่สูงมากนัก ช่วยให้คุณสามารถสร้างโปรแกรมต่างๆ ได้ แอปพลิเคชันแชท ผู้ช่วยสนับสนุนภายใน และตัวแทน AI ออฟไลน์มีประโยชน์มากสำหรับการสาธิตให้ลูกค้าดู หรือในสภาพแวดล้อมที่มีการเชื่อมต่อจำกัด
ด้วยสองโปรเจกต์นี้ คุณสามารถพัฒนาแอปพลิเคชันที่จำลองประสบการณ์การแชทของแพลตฟอร์มเชิงพาณิชย์หลัก ๆ ได้ ในขณะเดียวกันก็รักษาไว้ซึ่งการใช้งานแบบเดิม ๆ ควบคุมโครงสร้างพื้นฐาน ความเป็นส่วนตัว และความปลอดภัยทางไซเบอร์ได้อย่างสมบูรณ์จากมุมมองทางธุรกิจ ระบบเหล่านี้สามารถบูรณาการเข้ากับฐานข้อมูลภายใน ระบบออกตั๋ว หรือเครือข่ายภายในองค์กรได้ผ่านทาง ซอฟต์แวร์ที่กำหนดเอง.
PrivateGPT และ Haystack: เครื่องมือค้นหาและระบบตรวจสอบคุณภาพเอกสาร
หลายบริษัทต้องการ "ลอกเลียนแบบ" ฟังก์ชันการทำงานจากเครื่องมือต่างๆ เช่น โปรแกรมช่วยจัดทำเอกสาร หรือเครื่องมือค้นหาอัจฉริยะที่ตอบคำถามเกี่ยวกับคู่มือ สัญญา หรือนโยบายภายใน ในด้านนี้ พวกเขามีความโดดเด่น GPT ส่วนตัว y กองฟางที่ลึก.
GPT ส่วนตัวพร้อมใช้งานใน github.com/imartinez/privateGPTมันช่วยให้คุณ ตั้งคำถามและรวบรวมข้อมูลสรุปจากเอกสารท้องถิ่น (ไฟล์ PDF, สัญญา, รายงาน…) โดยไม่ต้องอัปโหลดอะไรขึ้นคลาวด์ เหมาะอย่างยิ่งสำหรับฝ่ายกฎหมาย ฝ่ายทรัพยากรบุคคล หรือทีมใดๆ ที่จัดการข้อมูลที่มีความละเอียดอ่อนเป็นพิเศษและมีข้อกำหนดที่เข้มงวด โลกไซเบอร์.
แนวคิดนี้เรียบง่ายมาก: คุณคัดลอกแหล่งเก็บข้อมูล เพิ่มไฟล์ของคุณ และระบบจะสร้างดัชนีที่คุณสามารถค้นหาได้โดยใช้ภาษาธรรมชาติ วิธีนี้ช่วยให้คุณ "จำลอง" ประสบการณ์แบบผู้ช่วยเอกสารระดับองค์กรได้โดยไม่ต้องพึ่งพาผู้ให้บริการภายนอก
กองหญ้าซึ่งคุณจะพบใน github.com/deepset-ai/haystackเป็นไลบรารีอเนกประสงค์สำหรับการสร้าง เครื่องมือค้นหาและระบบถามตอบ โดยอิงจากเอกสารภายในและแหล่งข้อมูลต่างๆ ช่วยให้สามารถผสานรวมฐานข้อมูล ตัวเชื่อมต่อ และโมเดลภาษาต่างๆ เพื่อสร้าง... เครื่องมือค้นหาข้อมูลองค์กรขั้นสูง.
เครื่องมือค้นหาเหล่านี้ทำงานร่วมกับได้เป็นอย่างดี บริการวิเคราะห์ข้อมูลทางธุรกิจและพาวเวอร์บีไอเพราะมันทำให้พนักงานทุกคนค้นหาข้อมูลที่ต้องการได้ง่าย และในขณะเดียวกันก็ช่วยให้นักวิเคราะห์สามารถใช้ประโยชน์จากเนื้อหานั้นเพื่อสร้างตัวชี้วัดและแดชบอร์ดได้ อีกครั้ง นี่คืออีกชั้นหนึ่งของ แอปพลิเคชันที่กำหนดเอง นี่คือส่วนที่กำหนดรูปแบบของโซลูชันขั้นสุดท้าย โดยมีการเข้าสู่ระบบขององค์กร การตรวจสอบ และการใช้งานบนบริการคลาวด์ AWS และ Azure เมื่อจำเป็น
Stable Diffusion WebUI AUTOMATIC1111: แอปสร้างภาพโคลน
หากคุณสนใจแอปพลิเคชันที่สร้างภาพจากข้อความ (เช่น DALL·E, Midjourney หรือแอปที่คล้ายกัน) โปรเจกต์ที่คุณควรลองดูคือ การแพร่กระจาย WebUI ที่เสถียร AUTOMATIC1111เป็นเว็บอินเทอร์เฟซที่ใช้งานได้ครบครันมาก การแพร่กระจายที่เสถียร พร้อมด้วยการตั้งค่าและส่วนขยายจำนวนมหาศาล
ที่เก็บข้อมูลตั้งอยู่ที่ github.com/AUTOMATIC1111/stable-diffusion-webui และยังมีตัวเลือกให้เลือกอีกด้วย ติดตั้งได้ในคลิกเดียว สามารถใช้งานได้บนเครื่องคอมพิวเตอร์หลายเครื่อง เมื่อติดตั้งและใช้งานได้แล้ว โปรแกรมนี้จะช่วยให้คุณสร้างภาพประกอบ เวอร์ชันผลิตภัณฑ์ พื้นหลัง โลโก้แบบต่างๆ หรือเนื้อหาทางการตลาดได้อย่างยืดหยุ่นมาก
ด้วยฐานนี้คุณสามารถ จำลองสาระสำคัญของแอปสร้างงานศิลปะด้วย AI เชิงพาณิชย์จำนวนมากแต่โฮสต์อยู่บนโครงสร้างพื้นฐานของคุณเอง พร้อมด้วยโมเดลและการตั้งค่าความปลอดภัยของคุณ บริษัทด้านการออกแบบ การตลาด หรือผลิตภัณฑ์สามารถใช้เพื่อสร้างต้นแบบแคมเปญ สร้าง... แบบจำลองผลิตภัณฑ์ และจัดเตรียมสื่อภาพเพื่อนำเสนอต่อลูกค้า
การก้าวไปสู่โซลูชันระดับมืออาชีพนั้นเกี่ยวข้องกับการเพิ่มชั้นของ... ซอฟต์แวร์ที่กำหนดเอง ควรจำกัดผู้ที่สามารถเข้าถึงข้อมูล บันทึกการใช้งาน จัดการคิวการสร้างภาพ และผสานรวมกับระบบคลาวด์ (เช่น GPU บน AWS หรือ Azure) ด้วยวิธีนี้ คุณจะมีแอปพลิเคชันสร้างภาพอัตโนมัติภายในองค์กรที่มีประสิทธิภาพเทียบเท่ากับเครื่องมือแบบเสียเงินหลายๆ ตัว
การโคลนเสียงแบบเรียลไทม์: จำลองเสียงอย่างมีความรับผิดชอบ
แอปพลิเคชันอีกประเภทหนึ่งที่โดดเด่นมากคือแอปพลิเคชันประเภทที่... การโคลนเสียง เริ่มต้นจากไฟล์เสียงเพียงไม่กี่วินาที โครงการนี้ การโคลนเสียงแบบเรียลไทม์โฮสต์ใน github.com/CorentinJ/Real-Time-Voice-Cloningมันช่วยให้คุณฝึกฝนโมเดลด้วยตัวอย่างสั้นๆ และสร้างเสียงพูดที่ฟังดูคล้ายกับเสียงต้นฉบับมาก
ในแง่เทคนิคแล้ว เทคโนโลยีนี้ทำให้สามารถ "ลอกเลียนแบบ" ความสามารถจากแอปพลิเคชันการโคลนเสียงและการสังเคราะห์เสียงขั้นสูงเชิงพาณิชย์ได้ อย่างไรก็ตาม จำเป็นอย่างยิ่งที่จะต้องใช้เทคโนโลยีนี้ในลักษณะที่... มีจริยธรรมและเคารพกฎระเบียบเนื่องจากความเสี่ยงต่อการนำไปใช้ในทางที่ผิดนั้นเห็นได้ชัด หากไม่มีการกำหนดกรอบการใช้งานที่ชัดเจน
ตัวอย่างการใช้งานอย่างมีความรับผิดชอบ ได้แก่ ผู้ช่วยเสียงส่วนบุคคล ระบบแจ้งเตือนด้วยเสียงอัตโนมัติสำหรับระบบบริการลูกค้าซึ่งรวมถึงการสร้างข้อความรอสายหรือคู่มือแบบโต้ตอบ โดยต้องได้รับความยินยอมอย่างชัดเจนจากบุคคลที่เสียงของพวกเขาถูกนำไปใช้เสมอ นอกจากนี้ยังเป็นประโยชน์สำหรับโครงการด้านการเข้าถึงหรือการฝึกอบรมอีกด้วย
การนำระบบแบบนี้ไปใช้งานจริงนั้นต้องอาศัยการเตรียมการอย่างจริงจัง ความปลอดภัยทางไซเบอร์และการกำกับดูแลข้อมูลเพื่อให้ระบบสามารถใช้งานได้เฉพาะในบริบทที่ได้รับอนุมัติ และมีการบันทึกว่าเสียง ข้อความ และผลลัพธ์ใดบ้างที่ถูกสร้างขึ้น โดยอยู่ในมือของทีมผู้เชี่ยวชาญใน แอปพลิเคชันแบบกำหนดเองและ AI สำหรับธุรกิจมันสามารถกลายเป็นองค์ประกอบสำคัญของประสบการณ์การสนทนาที่ซับซ้อนได้
OpenDevin: การลอกเลียนแบบผู้ช่วยเขียนโปรแกรมที่ขับเคลื่อนด้วย AI
เครื่องมือที่ช่วยในการเขียนโปรแกรมโดยใช้ AI เป็นอีกหนึ่งกลุ่มธุรกิจที่กำลังเติบโตอย่างรวดเร็ว OpenDevin เป็นโครงการโอเพนซอร์สที่มีฟังก์ชันการทำงานดังนี้ ผู้ช่วยโปรแกรมเมอร์: รับคำสั่งในภาษาธรรมชาติและสร้างโค้ด สคริปต์ หรือแก้ไขข้อมูลในคลังเก็บข้อมูลที่มีอยู่
โค้ดนี้สามารถดาวน์โหลดได้ที่นี่ github.com/OpenDevin/OpenDevin และเปิดโอกาสให้สร้างสภาพแวดล้อมที่ AI ทำงานร่วมกับนักพัฒนาที่เป็นมนุษย์เพื่อเร่งการพัฒนา ซอฟต์แวร์ที่กำหนดเองคุณสามารถเสนอคุณสมบัติใหม่ การทดสอบอัตโนมัติ เอกสารประกอบ หรือแม่แบบโครงการที่สมบูรณ์ได้
ด้วย OpenDevin คุณสามารถ "ลอกเลียนแบบ" สิ่งที่แพลตฟอร์ม Code Copilot เชิงพาณิชย์หลายแห่งทำได้ แต่ปรับให้เหมาะสมกับความต้องการของคุณ เทคโนโลยีและมาตรฐานภายใน ของบริษัทของคุณ คุณสามารถกำหนดค่าให้ระบบรู้จักแหล่งเก็บข้อมูล ไลบรารี และคู่มือสไตล์ของคุณ เพื่อให้คำแนะนำต่างๆ สอดคล้องกับความเป็นจริงของคุณ
ในระดับธุรกิจ สิ่งนี้หมายความว่า โครงการพัฒนาแอปพลิเคชันแบบกำหนดเองที่รวดเร็วยิ่งขึ้นด้วยข้อผิดพลาดที่เกิดขึ้นซ้ำน้อยลงและเอกสารประกอบที่ดีขึ้น นอกจากนี้ยังเปิดโอกาสให้ใช้เอเจนต์ AI ที่ทำงานอัตโนมัติสำหรับงานที่ซ้ำซาก เช่น การสร้างโครงร่าง API การย้ายโค้ด หรือสคริปต์การปรับใช้บนบริการคลาวด์ AWS และ Azure
Leon: ผู้ช่วยส่วนตัวแบบโอเพนซอร์สเพื่อเพิ่มประสิทธิภาพการทำงาน
หากคุณต้องการ "ลอกเลียนแบบ" ประสบการณ์ของการมี ผู้ช่วยเสียงส่วนตัว เหมือนกับ Alexa, Siri หรือ Google Assistant แต่คุณสามารถควบคุมแพลตฟอร์มได้อย่างสมบูรณ์ โครงการของคุณก็คือ... ลีอองผู้ช่วยโอเพนซอร์สนี้ตั้งอยู่ใน github.com/leon-ai/leon และได้รับการออกแบบให้ทำงานบนเครื่องโลคอล โดยมีโมดูลที่สามารถปรับแต่งได้
ลีออนถูกควบคุมโดย เสียงหรือข้อความ และยังสามารถจัดการงานต่างๆ เช่น การแจ้งเตือน การค้นหาข้อมูลอย่างรวดเร็ว การเชื่อมต่อกับบริการเว็บ หรือการเรียกใช้สคริปต์ในสภาพแวดล้อมของคุณเอง ข้อได้เปรียบที่สำคัญคือคุณสามารถ สร้างโมดูลของคุณเอง เพื่อปรับให้เข้ากับความต้องการเฉพาะของบริษัทของคุณ
โซลูชันเพิ่มประสิทธิภาพการทำงานภายในองค์กรมากมายสามารถสร้างขึ้นบนพื้นฐานของ Leon โดยบูรณาการเข้ากับระบบต่างๆ บริการคลาวด์ AWS และ Azure เพื่อซิงโครไนซ์ปฏิทิน จัดการงาน หรือรับการแจ้งเตือนจากระบบขององค์กร เนื่องจากเป็นโอเพนซอร์ส คุณจึงมีอิสระในการปรับเปลี่ยนพฤติกรรม อินเทอร์เฟซ และการไหลของข้อมูล
ด้วยการสนับสนุนที่เหมาะสมจากทีมผู้เชี่ยวชาญใน ปัญญาประดิษฐ์ แอปพลิเคชันที่กำหนดเอง และความปลอดภัยทางไซเบอร์Leon สามารถกลายเป็นจุดเชื่อมต่อมาตรฐานสำหรับพนักงานของคุณได้: ผู้ช่วยที่เข้าใจบริบทของธุรกิจของคุณ เคารพนโยบายของคุณ และสามารถใช้งานได้ทุกที่ที่คุณต้องการ
แกลเลอรี่ Google AI Edge: บอทท้องถิ่นบนมือถือเพื่อคัดลอกแอป AI
นอกเหนือจากโปรเจ็กต์บนเดสก์ท็อปหรือเซิร์ฟเวอร์แล้ว คุณยังสามารถ "คัดลอก" แอปพลิเคชันมือถือ AI จำนวนมากได้โดยใช้ แกลเลอรี Google AI Edgeแอปพลิเคชัน Android แบบโอเพนซอร์สที่ออกแบบมาเพื่อใช้งาน โมเดลปัญญาประดิษฐ์ในท้องถิ่น บนอุปกรณ์นั้นเอง
ด้วยแอพพลิเคชั่นนี้คุณสามารถ สนทนากับบอท สร้างภาพ หรือออกแบบข้อความแจ้งเตือนทั้งหมดนี้ทำได้โดยที่ข้อมูลไม่เคยออกจากโทรศัพท์ของคุณเลย แนวทางนั้นชัดเจน: การประมวลผลทั้งหมดทำในเครื่อง ซึ่งให้ความเป็นส่วนตัวมากกว่าบริการคลาวด์ ในทางกลับกัน กำลังการประมวลผลของโมเดลเหล่านี้มักจะน้อยกว่าโซลูชันอย่าง ChatGPT, Copilot, Gemini หรือ DeepSeek
Google AI Edge Gallery เป็นแอปพลิเคชัน ฟรีและโอเพ่นซอร์สออกแบบมาสำหรับผู้ใช้ที่มีประสบการณ์บ้าง ไม่สามารถดาวน์โหลดได้จาก Google Play คุณต้องดาวน์โหลดไฟล์ APK จาก [แหล่งที่มาหายไป] github.com/google-ai-edgeในส่วน เริ่มต้นในไม่กี่นาทีซึ่งคุณจะเห็นลิงก์ไปยัง APK ล่าสุดจากนั้นคุณจะต้องอนุญาตให้ติดตั้งแอปจากแหล่งที่ไม่รู้จักบนอุปกรณ์มือถือของคุณจึงจะสามารถใช้งานได้
ภายในแอปมี สามส่วนหลักส่วนหนึ่งเน้นการสร้างภาพ อีกส่วนหนึ่งเน้นการออกแบบข้อความแจ้งเตือน และส่วนที่สามสำหรับการแชทกับ AI ซึ่งคล้ายคลึงกับสิ่งที่ ChatGPT นำเสนอมากที่สุด แต่ละส่วนจะแสดงโมเดลที่มีให้เลือก ขนาดของโมเดล และตัวเลือกในการดาวน์โหลดและติดตั้งลงในโทรศัพท์ของคุณ คุณยังสามารถนำเข้าไฟล์โมเดล AI ที่คุณมีอยู่แล้วในโทรศัพท์ได้โดยใช้ปุ่ม + ที่มุมล่างขวา
แนวทางนี้เปิดโอกาสให้นักพัฒนาและบริษัทต่างๆ สามารถ ทดลองใช้งาน AI ต้นแบบได้โดยตรงบนอุปกรณ์มันคัดลอกฟังก์ชันการทำงานหลายอย่างมาจากแอปพลิเคชันเชิงพาณิชย์ แต่มีความยืดหยุ่นในการใช้โมเดลโอเพนซอร์สและไม่ต้องส่งข้อมูลไปยังบุคคลที่สาม จึงเป็นพื้นฐานที่เหมาะสมสำหรับโครงการต่างๆ ใน แอปพลิเคชันมือถือแบบกำหนดเองโดยเฉพาะอย่างยิ่งเมื่อใช้งานร่วมกับระบบแบ็กเอนด์ที่ปลอดภัยซึ่งใช้งานบนบริการคลาวด์ AWS และ Azure
Base44: แพลตฟอร์มอเนกประสงค์สำหรับการจำลองกระบวนการทำงานทางธุรกิจ
นอกเหนือจากโครงการที่เกี่ยวข้องโดยตรงกับภาษา การมองเห็น หรือแบบจำลองเสียงแล้ว ยังมีแพลตฟอร์มอื่นๆ เช่น Base44 ที่มุ่งเน้นการสร้าง แอปพลิเคชันทางธุรกิจอย่างรวดเร็วแม้ว่ามันจะไม่ใช่โมเดล AI โดยตรง แต่มันก็สามารถทำงานร่วมกับบริการอัจฉริยะได้อย่างลงตัว และช่วยให้คุณ "คัดลอก" ขั้นตอนการทำงานทั่วไปจากเครื่องมือการจัดการได้มากมาย
ด้วย Base44 คุณสามารถสร้างสิ่งต่างๆ ได้ แอปเพิ่มประสิทธิภาพการทำงานส่วนบุคคล, เครื่องมือสำหรับงานเบื้องหลัง, พอร์ทัลลูกค้า หรือโซลูชันการทำงานอัตโนมัติของกระบวนการทางธุรกิจ นอกจากนี้ยังเป็นตัวเลือกที่ยอดเยี่ยมสำหรับการตั้งค่าอีกด้วย ต้นแบบและ MVPการทดสอบแนวคิดผลิตภัณฑ์โดยไม่จำเป็นต้องพัฒนาโครงสร้างพื้นฐานทั้งหมดตั้งแต่เริ่มต้น
พลังที่แท้จริงจะปรากฏขึ้นเมื่อคุณผสานแพลตฟอร์มนี้เข้ากับโครงการ AI ที่เราได้เห็นไปแล้ว: คุณสามารถสร้างพอร์ทัลลูกค้าได้ด้วย แชทบอทภายในที่ใช้ GPT4All หรือ llama.cppเช่น การผสานรวมเครื่องมือค้นหาด้วย Haystack, การเพิ่มโมดูลถอดเสียงด้วย Whisper หรือการรวมระบบสร้างภาพโดยใช้ Stable Diffusion
สำหรับภาคธุรกิจ นี่หมายถึงการเร่งการสร้างสรรค์สิ่งใหม่ๆ ซอฟต์แวร์ที่กำหนดเอง ซึ่งจำลองฟังก์ชันการทำงานของโซลูชันเฉพาะกลุ่มที่เป็นที่รู้จักกันดี แต่ปรับให้เข้ากับกฎทางธุรกิจ ระบบที่มีอยู่ และความต้องการของคุณ ความปลอดภัยทางไซเบอร์และระบบข่าวกรองธุรกิจผลลัพธ์ที่ได้: ควบคุมได้มากขึ้น พึ่งพาใบอนุญาตน้อยลง และโซลูชันที่สอดคล้องกับกระบวนการทำงานของคุณอย่างสมบูรณ์แบบ
วิธีเลือกโครงการที่เหมาะสมกับสถานการณ์ของคุณ
ในเมื่อมีตัวเลือกโอเพนซอร์สมากมาย คำถามสำคัญก็คือ... วิธีการเลือกโครงการ AI ที่เหมาะสมที่สุด สิ่งที่คุณต้อง "คัดลอก" หรือทำซ้ำนั้น คำตอบอยู่ที่การกำหนดวัตถุประสงค์ทางธุรกิจก่อน จากนั้นจึงจับคู่กับเครื่องมือที่เหมาะสมที่สุด
หากคุณต้องการ ถอดเสียงเป็นข้อความ สำหรับการสร้างนาทีการใช้งานหรือป้อนข้อมูลเข้าสู่ระบบค้นหา Whisper คือตัวเลือกที่เหมาะสมที่สุด ตัวแทนอิสระ สำหรับผู้ที่มีหน้าที่วางแผนและดำเนินการต่างๆ AutoGPT เหมาะสมกว่า ในการสร้าง แชทบอทท้องถิ่นตัวเลือกที่ดีที่สุดคือการประเมิน GPT4All หรือ llama.cpp โดยพิจารณาจากฮาร์ดแวร์และข้อจำกัดด้านความเป็นส่วนตัวของคุณ
เมื่อเป้าหมายคือการตั้งคำถามเกี่ยวกับเอกสารภายใน แนวทางที่เหมาะสมที่สุดคือการพิจารณา PrivateGPT หรือ Haystackขึ้นอยู่กับว่าคุณต้องการอะไรที่ปิดและจำกัดเฉพาะที่ หรือแพลตฟอร์มที่ยืดหยุ่นมากซึ่งรวมแหล่งข้อมูลหลายแหล่งเข้าด้วยกัน สำหรับด้านภาพนั้น Stable Diffusion WebUI จะช่วยให้คุณจำลองแอปสร้างภาพได้หลายแอป ในขณะที่ Real Time Voice Cloning เป็นรากฐานสำหรับโซลูชันต่างๆ เสียงสังเคราะห์ ปรับแต่งได้ตามความต้องการเฉพาะบุคคลอย่างมาก
หากคุณต้องการเพิ่มประสิทธิภาพการทำงานของทีมพัฒนาของคุณ OpenDevin นี่เป็นจุดเริ่มต้นที่ดี และเหมาะสำหรับการเสนอให้กับพนักงานหรือผู้ใช้งาน ผู้ช่วยส่วนตัวที่ควบคุมด้วยเสียงLeon สามารถเป็นพันธมิตรที่ดีที่สุดของคุณได้ ในด้านมือถือ Google AI Edge Gallery เปิดประตูสู่ประสบการณ์ AI ในพื้นที่บน Android และแพลตฟอร์มอย่าง Base44 ช่วยให้การนำส่วนประกอบทั้งหมดเหล่านี้มารวมกันเป็นเรื่องง่าย แอปพลิเคชันองค์กรที่สอดคล้องกัน.
เมื่อเป้าหมายคือการเปลี่ยนจากการทดสอบภายในไปสู่โซลูชันทางธุรกิจที่แข็งแกร่ง การพึ่งพาบริษัทที่มีความเชี่ยวชาญในด้านนี้จึงเป็นเรื่องที่สมเหตุสมผลอย่างยิ่ง การพัฒนาซอฟต์แวร์แบบกำหนดเอง ปัญญาประดิษฐ์ ความปลอดภัยทางไซเบอร์ และบริการคลาวด์ AWS และ Azureสามารถสร้างสถาปัตยกรรมที่ปรับขนาดได้ ปลอดภัย และผสานรวมเข้ากับระบบนิเวศปัจจุบันของคุณได้อย่างลงตัว
เหตุใดจึงต้องพึ่งพาพันธมิตรผู้เชี่ยวชาญในการบูรณาการโครงการเหล่านี้?
แม้ว่าโปรเจ็กต์ทั้งหมดที่เราได้เห็นจะเป็นโอเพนซอร์สและพร้อมใช้งานบน GitHub แต่การนำไปใช้งานจริงภายในบริษัทนั้นไม่ง่ายเหมือนกับการโคลน repository แล้วกดปุ่มเพียงครั้งเดียว มันต้องใช้... มีประสบการณ์ด้านสถาปัตยกรรมซอฟต์แวร์ การใช้งานระบบคลาวด์ ความปลอดภัยทางไซเบอร์ และการกำกับดูแลข้อมูล.
พันธมิตรผู้เชี่ยวชาญเช่น Q2BSTUDIOโดยมีประวัติผลงานที่พิสูจน์ได้ใน แอปพลิเคชันแบบกำหนดเอง ซอฟต์แวร์แบบกำหนดเอง ปัญญาประดิษฐ์ และ AI สำหรับธุรกิจระบบนี้สามารถวิเคราะห์กระบวนการทำงานของคุณ เลือกส่วนประกอบ AI ที่เหมาะสมที่สุด และออกแบบโซลูชันแบบครบวงจร ตั้งแต่ส่วนติดต่อผู้ใช้ไปจนถึงบริการคลาวด์
ทีมประเภทนี้จะช่วยให้มั่นใจได้ว่าโซลูชันนั้นสอดคล้องกับกฎระเบียบของอุตสาหกรรมของคุณ และมีการนำแนวปฏิบัติที่ดีที่สุดมาใช้ โลกไซเบอร์เพื่อให้การเชื่อมต่อกับระบบงานเบื้องหลังของคุณมีความเสถียร และเพื่อให้โครงสร้างพื้นฐานใน บริการคลาวด์ AWS และ Azure ได้รับการปรับให้เหมาะสมที่สุดทั้งในแง่ของต้นทุนและประสิทธิภาพ
นอกจากนี้ พวกเขายังสามารถเสริมโครงการโอเพนซอร์สได้อีกด้วย บริการวิเคราะห์ข้อมูลทางธุรกิจและพาวเวอร์บีไอสร้างแดชบอร์ดที่แสดงผลกระทบที่แท้จริงของ AI ต่อกระบวนการของคุณ เช่น ลดเวลา ปรับปรุงคุณภาพ เพิ่มความพึงพอใจของลูกค้า เป็นต้น ด้วยวิธีนี้ คุณจะไม่เพียงแค่ "คัดลอก" ฟังก์ชันการทำงานจากแอปที่มีอยู่ แต่คุณจะบรรลุเป้าหมายที่แตกต่างออกไป ความได้เปรียบในการแข่งขันที่แตกต่างกัน.
กล่าวโดยสรุป ระบบนิเวศ AI แบบโอเพนซอร์สได้นำเครื่องมืออันทรงพลังอย่างเหลือเชื่อมาสู่การใช้งาน คัดลอกและปรับปรุงแอปพลิเคชันด้วยปัญญาประดิษฐ์แต่การมีพันธมิตรผู้เชี่ยวชาญคือสิ่งที่สร้างความแตกต่างระหว่างการทดลองกับโซลูชันระดับมืออาชีพที่พร้อมสำหรับการขยายขนาด
ผลรวมของโครงการต่างๆ เช่น Whisper, AutoGPT, GPT4All, PrivateGPT, Stable Diffusion WebUI, Haystack, Real Time Voice Cloning, OpenDevin, Leon, Google AI Edge Gallery และแพลตฟอร์มต่างๆ เช่น Base44 แสดงให้เห็นว่าในปัจจุบันเป็นไปได้โดยสิ้นเชิงที่จะจำลอง ผสาน และก้าวข้ามฟังก์ชันการทำงานมากมายของแอปพลิเคชัน AI ขนาดใหญ่ผ่าน ซอฟต์แวร์ที่ออกแบบเฉพาะ บริการคลาวด์ ระบบรักษาความปลอดภัยทางไซเบอร์ที่แข็งแกร่ง และระบบวิเคราะห์ข้อมูลทางธุรกิจเราสร้างโซลูชันของเราเองที่เคารพความเป็นส่วนตัว ผสานรวมเข้ากับระบบของคุณ และออกแบบมาโดยเฉพาะให้เหมาะสมกับวิธีการทำงานขององค์กรของคุณ
นักเขียนผู้หลงใหลเกี่ยวกับโลกแห่งไบต์และเทคโนโลยีโดยทั่วไป ฉันชอบแบ่งปันความรู้ผ่านการเขียน และนั่นคือสิ่งที่ฉันจะทำในบล็อกนี้ เพื่อแสดงให้คุณเห็นสิ่งที่น่าสนใจที่สุดเกี่ยวกับอุปกรณ์ ซอฟต์แวร์ ฮาร์ดแวร์ แนวโน้มทางเทคโนโลยี และอื่นๆ เป้าหมายของฉันคือการช่วยคุณนำทางโลกดิจิทัลด้วยวิธีที่เรียบง่ายและสนุกสนาน
