Vad är PageRank?
En algoritm som rankar hemsidor (web pages) baserat på deras importance och relevans.
Importance mäts baserat på Antalet och Kvaliten av länkar som pekar till den sidan.
Ett underliggande antagande är att viktigare hemsidor har är länkade till från flera andra hemsidor.
Hur fungerar PageRank algorithmen?
Webben representeras som en riktad graf
Vad är Natural Language Processing?
Understanding och Generation of natural (human) language?
Subfield of AI that focuses on the interaction between computers and humans through natural language. The goal of NLP is to enable computers to understand, interpret, and respond to human language in a way that is both meaningful and useful.
Vad är de huvudsakliga uppgifterna av NLP?
Key Stages of Processing Language (Traditional)
Vad innebär Lexical Analysis?
Syntactic Analysis
Checking for correct word order and hierarchical organization
Semantic Analysis
Pragmatic Analysis
Vad är Bag-Of-Words?
Technique in natural language processing for: Text Representation and Feature Extraction
Converts text into numberical feature vectors.
Vad fokuserar BOW model på?
Focuses solely on the frequency of words in the text
Hur fungerar BOW modelen?
Vad används BOW modellen för?
Vilka är Algorithms for content analysis of documents?
Vad är Latent Semantic Analysis (LSA)?
Algorithm used for analyzing the content of a document.
Analyzes the relationship between words and phrases in a document to identify the underlying concepts
- Used to identify related terms, find synonyms and group similar documents together
Vad är applikationer av LSA?
Vilka är stegen av LSA
Steps of LSA
1. Document-Term Matrix Creation
a. Rows - documents
b. Columns - Words
c. Each cell in the matrix represents the frequency of term in the document
2. Term Weighting
a. The raw frequency counts in the document-term matrix are typically transformed using term weighting schemes to reflext the importance of terms in documents
3. Singular Value Decomposition (SVD)
4. Dimensionality Reduction
5. Concept space representation
Vad är Named Entity Recognition (NER)?
Algorithm used to analyze the content of documents.
Locate and classify named entities mentioned in unstructured text into pre-defined categories
Eg. Person, Organizations, monetary values etc.
Vad är Sentiment Analysis?
Algorithm used for analyzing the content of a document.
Also known as Opinion Mining or Emotion AI
Uses NLP, text analysis,to systemtically identify, extract, quantify and study affective states and subjective information
Goal is to answer the question: “What do people feel about a certain topic?”
Exempel på textanalytiska programvaror och deras funktion?
Vad är några algorithmer som mäter relationships in a web of documents (web pages)?
Vad är Bayes Sats?
Vad för algoritmer används för feature extraction?
Bag-of-Words (BoW)