Phân tích cảm xúc trong Excel! Có một phần bổ trợ miễn phí từ Microsoft Labs sẽ cho phép bạn phân tích cảm xúc trong Excel. Điều gì sẽ xảy ra nếu bạn phải lội qua hàng trăm bình luận khảo sát để xem mọi người nghĩ gì về công ty của bạn? Excel có thể gán một xác suất cho biết mức độ tích cực hay tiêu cực của mỗi nhận xét.
Xem video
- Dễ dàng định lượng dữ liệu khảo sát khi nó là nhiều lựa chọn
- Bạn có thể sử dụng bảng tổng hợp để tìm ra phần trăm mỗi câu trả lời có
- Nhưng còn câu trả lời dạng văn bản tự do thì sao? Rất khó để xử lý những thứ này nếu bạn có hàng trăm hoặc hàng nghìn cái.
- Phân tích cảm xúc là một phương pháp dựa trên máy để dự đoán xem câu trả lời là tích cực hay tiêu cực.
- Microsoft cung cấp một công cụ phân tích cảm xúc trong Excel - Azure Machine Learning.
- Phân tích tình cảm truyền thống yêu cầu một con người phân tích và phân loại 5% các câu nói.
- Phân tích tình cảm truyền thống không linh hoạt - bạn sẽ xây dựng lại từ điển cho từng ngành.
- Excel sử dụng MPQA Chủ quan Lexicon (đọc về điều đó tại http: // bit. Ly / 1SRNevt)
- Từ điển chung này bao gồm 5.097 từ tiêu cực và 2.533 từ tích cực
- Mỗi từ được gán một phân cực mạnh hoặc yếu
- Điều này hoạt động tốt cho các câu ngắn, chẳng hạn như Tweet hoặc bài đăng trên Facebook
- Nó có thể bị đánh lừa bởi âm tính kép
- Để cài đặt, hãy vào Insert, Excel Store, tìm kiếm Azure Machine Learning
- Chỉ định một phạm vi đầu vào và hai cột trống cho phạm vi đầu ra.
- Tiêu đề cho phạm vi đầu vào phải khớp với lược đồ: tweet_text
- Bài viết đồng hành tại: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Bản ghi video
Học Excel từ Podcast, Tập 2062: Phân tích tình cảm trong Excel
Ồ, đó là một đêm Lễ Tạ ơn và chúng tôi đang ngồi quanh chiếc bánh bí ngô và Jes, một người bạn của chúng tôi, bắt đầu nói về việc phân tích tình cảm trên dữ liệu Twitter. Và tôi nói, "Này, bạn biết rằng Excel có cách để thực hiện phân tích tình cảm." Và tôi nhận ra rằng tôi không có video hay về điều này hoặc bất kỳ video nào về điều này, vì vậy video này là về thực hiện phân tích cảm xúc trong Excel.
Bây giờ câu hỏi đầu tiên là, phân tích tình cảm là cái quái gì? Và nếu bạn thực hiện một cuộc khảo sát khách hàng của mình và họ có một lựa chọn nhiều lựa chọn, trong đó họ có thể chọn từ 1 đến 5, thì điều đó thực sự rất dễ phân tích. Bạn chỉ có thể tạo một bảng tổng hợp nhỏ: Chèn bảng tổng hợp, Trang tính hiện có ngay tại đây, bấm OK. Chúng tôi muốn biết câu hỏi ở đó hoặc câu trả lời cho câu hỏi, sau đó có bao nhiêu câu trả lời cho mỗi câu trả lời và điều đó cho chúng tôi con số tuyệt đối. Bạn thậm chí có thể vào đây và thay đổi điều này từ Cài đặt trường thành Hiển thị giá trị dưới dạng% của Tổng số cột, như vậy.
Được rồi, bạn có thể biết tỷ lệ phần trăm số người nhận được câu trả lời cho mỗi câu trả lời là bao nhiêu. Được rồi, nhưng phân tích tình cảm dành cho khi bạn có một câu trả lời thực sự dài trong đó bạn nói, "Này, được rồi, bạn biết đấy, hãy cho chúng tôi biết tại sao bạn lại đưa ra câu trả lời đó?" Và họ, bạn biết đấy, sử dụng câu hoặc đoạn văn. Chà, nếu bạn có hàng trăm hoặc hàng nghìn cái này, rất khó để ai đó đọc qua nó và đọc hết chúng và tìm ra chuyện gì đang xảy ra, được chứ?
Vì vậy, có hai loại phân tích tình cảm khác nhau. Thông thường, trước đây, bạn sử dụng thuật toán học tập có giám sát của con người. Vì vậy, nếu bạn có 5.000 câu trả lời, bạn biết đấy, hãy lướt qua 200 câu trả lời và chọn những từ và cụm từ tích cực và tiêu cực. Về cơ bản, bạn đang xây dựng một từ điển về các từ tích cực và tiêu cực; nhưng, bạn biết đấy, điều này rất hạn chế. Nếu bạn làm điều này cho một nơi sửa xe và sau đó có một khách hàng khác, bạn biết đấy, ai đã giặt thảm, hai từ điển đó hoàn toàn khác nhau. Bạn phải thực hiện học máy hoặc học tập có sự giám sát của con người lặp đi lặp lại. Vì vậy, Excel sử dụng thứ này được gọi là MPQA Chủ quan Lexicon và bạn có thể truy cập Google. Nó có thông tin về nó - 5.097 từ tiêu cực, 2533 từ tích cực. Và vì thế,nó hoạt động tốt cho các câu ngắn hoặc Tweet hoặc bài đăng trên Facebook. Nhưng có một điều tôi nhận thấy là nếu ai đó viết bằng âm kép, tôi không thể nói rằng tôi không ghét tính năng này, tốt, máy học sẽ thất bại ở đó. Và chết tiệt, tôi thất bại. Tôi không thể biết họ có hạnh phúc hay không.
Được rồi, đây là những gì chúng tôi làm. Trong Excel 2013 hoặc Excel 2016, hãy chuyển đến tab Chèn, chuyển đến Cửa hàng, khi hộp tìm kiếm xuất hiện tìm kiếm Azure Machine và bạn nhận được Azure Machine Learning ngay tại đó. Chúng tôi nhấp vào Thêm. Được rồi, và hai công cụ khác nhau ở đây: Máy dự đoán Người sống sót trên tàu Titanic, rất thú vị; và, phần bổ trợ Excel phân tích tình cảm văn bản. Hãy sử dụng cái đó. Được rồi, đây là một số điều sẽ giúp bạn phát triển. Tiêu đề của bạn: Hãy dành một đoạn văn để giải thích câu trả lời của bạn. Nó cần phải khớp với Lược đồ và Lược đồ nói rằng tiêu đề phải có nội dung tweet_text. Vì vậy, ở đây: tweet_text, tất nhiên, các vấn đề phân biệt chữ hoa chữ thường, được rồi. Và sau đó đóng Lược đồ, sau đó Dự đoán, Đầu vào: A1 đến 100, Dữ liệu của tôi có tiêu đề, Đầu ra: DataB1, Bao gồm các tiêu đề. Họ sẽ cung cấp cho chúng ta 2 cột.Đảm bảo rằng bạn có 2 cột trống ở đó; nếu không, nó sẽ ghi đè dữ liệu. Bạn có 2 lựa chọn: Một vài hàng cùng một lúc hoặc Theo một loạt. Đây chỉ là một trăm, vì vậy nó thực sự không quan trọng. Tôi sẽ chọn Dự đoán và BAM! Nhanh như vậy thôi.
Được rồi, bây giờ chúng ta nhận được 2 cột: chúng ta nhận được Cảm xúc và Điểm, được thôi. Vì vậy, hãy biểu diễn điểm số ở đây dưới dạng tỷ lệ phần trăm với một loạt các chữ số thập phân. Được rồi, 47,496, tỷ lệ này tăng từ 0 đến 100%. Gần 100 là cực dương, gần 0 là cực âm, được không? Vì vậy, ở đây, chúng tôi có một nơi có một vấn đề nhỏ, khiến tôi phát điên. Không thể tìm ra giải pháp, vì vậy bạn có thể thấy lý do tại sao nó được đánh giá là cực kỳ tiêu cực. Hãy xem xét một điều vô cùng tích cực. Được rồi, bạn biết đấy, vì vậy chúng tôi có một số từ vui ở đây: làm ơn và cảm ơn bạn, dấu chấm than, v.v. Điều đó có thể góp phần vào điểm số cao. Được rồi, vậy nó có hoàn hảo không? Không, nhưng nó sẽ cung cấp cho bạn một cách nhanh chóng để cho bạn biết, bạn biết đấy, có bao nhiêu người cực kỳ hài lòng hoặc cực kỳ tiêu cực về những câu trả lời đó.
Và tất nhiên, một lần nữa, ở đây chúng ta có thể thực hiện việc này với bảng tổng hợp: Chèn, Bảng tổng hợp, đi tới Trang tính hiện có ngay tại đây, nhấp vào OK, và chúng tôi quan tâm đến Cảm xúc, và sau đó có thể với Điểm trung bình dành cho mỗi cái đó. Vì vậy, chúng tôi sẽ thay đổi điều này trong Cài đặt Trường thành Trung bình, nhấp vào OK. Và như vậy, hoặc thậm chí có thể là một Bá tước. Tôi đoán chúng ta muốn biết Bá tước, bao nhiêu người. Vì vậy, chúng tôi sẽ lấy một số lĩnh vực khác, và do đó, chúng tôi biết có bao nhiêu người tiêu cực. Ồ, có bao nhiêu người trung lập, bao nhiêu người tích cực và điểm trung bình của mỗi người đó là bao nhiêu.
Được rồi, vì vậy nếu bạn có dữ liệu khảo sát và đó là một lựa chọn trắc nghiệm, thì bạn có thể dễ dàng sử dụng bảng tổng hợp để tìm ra phần trăm mỗi câu trả lời có. Nhưng đối với các câu trả lời dạng văn bản tự do, rất khó để xử lý. Nếu bạn có hàng trăm hoặc hàng nghìn câu trả lời, phân tích cảm xúc là một phương pháp dựa trên máy móc để dự đoán xem câu trả lời là tích cực hay tiêu cực. Microsoft cung cấp một công cụ miễn phí cho việc này. Hoạt động trong Excel 2013 hoặc Excel 2016, được gọi là Azure Machine Learning. Thường phải xem qua và phân loại 5% các câu lệnh bằng tay. Nó không linh hoạt, bạn phải phân loại lại cho từng tập dữ liệu mới, nhưng Excel đang sử dụng Lexicon Chủ quan MPQA này. Đó là một từ điển chung. Nó sẽ hoạt động đối với các câu ngắn, Tweet, bài đăng trên Facebook. Tôi có thể bị đánh lừa bởi hai từ phủ định. Vì vậy, chỉ cần truy cập Excel Store,tìm kiếm Azure Machine Learning. Chỉ định một đầu vào và hai cột cho một phạm vi đầu ra. Đừng quên thay đổi tiêu đề để khớp với Lược đồ, tweet_text, trong trường hợp cụ thể này.
Được rồi, vậy là xong. Lần tới khi bạn có một lượng lớn dữ liệu cần phân tích, hãy sử dụng Azure Machine Learning, Phần bổ trợ miễn phí dành cho Excel 2013. Cảm ơn bạn đã ghé qua, chúng tôi sẽ gặp bạn lần sau với một netcast khác.
Tải tập tin
Tải xuống tệp mẫu tại đây: Podcast2062.xlsm