Substantiv i russisk språk listefil. Frekvensordbok for det russiske språket

Betydningen av ordet NOUN i Ozhegov Russian Dictionary

SUBSTANTIV

substantiv == substantiv Bøyning av substantiver. substantiv I grammatikk: en orddel som betegner et objekt og uttrykker objektets betydning i form av kjønn, tall og kasus Konkrete og abstrakte substantiv. Egennavn og vanlige substantiv. Substantiv, levende og livløs.

Ozhegov. Ozhegovs ordbok for det russiske språket. 2012

Se også tolkninger, synonymer, betydninger av ord og hva et substantiv er på russisk i ordbøker, leksikon og oppslagsverk:

  • SUBSTANTIV i stort encyklopedisk ordbok:
  • SUBSTANTIV
    orddel, en klasse av fullverdige ord (lexemes), som inkluderer navn på objekter og levende vesener og kan vises i en setning ...
  • SUBSTANTIV i Modern Encyclopedic Dictionary:
  • SUBSTANTIV i Encyclopedic Dictionary:
    del av talen som betegner objekter (ting, stoffer, mennesker, dyr), egenskaper abstrahert fra deres bærer ("vennlighet"), handlinger og tilstander abstrahert fra ...
  • SUBSTANTIV i Encyclopedic Dictionary:
    ,-oto, jfr. eller et substantiv - i grammatikk: en del av tale som betegner et objekt og uttrykker betydningen av objektet i former for kjønn, ...
  • SUBSTANTIV i Big Russian Encyclopedic Dictionary:
    substantiv, en klasse av fullbetydende ord (del av tale), som inkluderer navnet. gjenstander og levende vesener og kan vises i en setning...
  • SUBSTANTIV
    - en klasse med fullbetydende ord (ordedel), som inkluderer navn på objekter og levende vesener og kan vises i en setning i henhold til ...
  • SUBSTANTIV
    se substantiv...
  • SUBSTANTIV i ordboken for synonymer av det russiske språket.
  • SUBSTANTIV i New Explanatory Dictionary of the Russian Language av Efremova:
  • SUBSTANTIV i den komplette staveordboken for det russiske språket:
    substantiv, …
  • SUBSTANTIV i rettskrivningsordboken:
    substantiv...
  • SUBSTANTIV i moderne forklarende ordbok, TSB:
    en klasse med fullbetydende ord (ordedel), som inkluderer navn på objekter og levende vesener og kan vises i en setning i ...
  • SUBSTANTIV i Ephraims forklarende ordbok:
    substantiv jfr. En del av tale som betegner et emne og vanligvis varierer etter kasus og antall; substantiv (i...
  • SUBSTANTIV i New Dictionary of the Russian Language av Efremova:
    ons En del av tale som betegner et emne og vanligvis varierer etter kasus og antall; substantiv (i...
  • SUBSTANTIV i Large Modern Explanatory Dictionary of the Russian Language:
    ons En del av tale som betegner et emne og vanligvis varierer etter kasus og antall; substantiv (i lingvistikk) ...
  • ENGELSKE SPRÅK i Literary Encyclopedia:
    Språk blandet. Ved sin opprinnelse er den assosiert med den vestlige grenen av den germanske språkgruppen. (cm.). Det er vanlig å dele historien til A. Yaz. på …
  • DELER AV TALE i stort Sovjetisk leksikon, TSB:
    tale, hovedklassene av ord i et språk, skilt ut på grunnlag av likheten mellom deres syntaktiske (se syntaks), morfologiske (se morfologi) og logisk-semantiske (se ...
  • DELER AV TALE i Linguistic Encyclopedic Dictionary:
    - klasser av ord i et språk, skilt ut på grunnlag av fellesheten til deres syntaktiske (se syntaks), morfologiske (se morfologi) og semantiske (se semantikk) egenskaper. ...
  • ORDSTILLING i Linguistic Encyclopedic Dictionary:
    - et bestemt arrangement av ord i en setning eller syntaks. gruppe. Strukturelle typer P. s. avvike i det følgende. opposisjoner: progressive eller konsekvente...
  • PERIFRASE i Linguistic Encyclopedic Dictionary:
    (periphrasis) (fra gresk, periphrasis - beskrivende uttrykk, allegori) - en stilistisk innretning som består i en indirekte, beskrivende betegnelse av objekter og virkelighetsfenomener ...
  • NAVNEKLASSER i Linguistic Encyclopedic Dictionary:
    - en leksikalsk-grammatisk kategori av et substantiv, bestående av fordeling av navn i grupper (klasser) i samsvar med eldgamle semantiske trekk med den obligatoriske formelle ...
  • BALTISKE SPRÅK i Linguistic Encyclopedic Dictionary:
    - en gruppe indoeuropeiske språk. B. i. bevare den gamle indoeuropeiske kulturen mer fullstendig. språksystem enn andre moderne. Indoeuropeiske grupper. språkfamilier. Det er et poeng...
  • ADAMUA-ØST SPRÅK i Linguistic Encyclopedic Dictionary.
  • DELER AV TALE i Dictionary of Linguistic Terms:
    De viktigste leksikalske og grammatiske kategoriene som ord i et språk er fordelt i basert på følgende egenskaper: a) semantisk (generalisert betydning av et objekt, handling eller tilstand, kvalitet ...
  • AVTALE OM MENING i Dictionary of Linguistic Terms:
    Valget av tallform eller kjønn for predikatet er ikke basert på grammatisk likhet med uttrykksformen til subjektet, men på det semantiske forholdet mellom begge...
  • SAK i Dictionary of Linguistic Terms:
    1 (sakskategori). En grammatisk kategori av et substantiv som uttrykker forholdet mellom objektet det betegner til andre objekter, handlinger og egenskaper. Visner bort i romansk...
  • KARAKTER i Popular Explanatory Encyclopedic Dictionary of the Russian Language:
    -a, m. Skuespiller i kunstnerisk, dramatisk arbeid og sjangermaleri. Komisk karakter. Negativ karakter. Tsjekhovs karakterer. Karakterer av russisk folk ...

Andre versjon av frekvenslisten

På denne siden kan du få lister over de vanligste ordene i det russiske språket. Inntil nå Frekvensordbok Russisk språk utg. L.N. Zasorina (1977) ble oftest brukt som en kilde til informasjon om frekvensen av russiske ord. Korpuset som frekvensen av ord i denne ordboken ble beregnet fra er imidlertid svært lite etter moderne standarder (omtrent en million ord). I tillegg er listen betydelig utdatert: den tilsvarer hyppigheten av bruk av ord i perioden fra 20- til 60-tallet. Som et resultat inkluderer korpuset et stort antall ideologiske kilder, for eksempel verkene til Lenin og Kalinin, materialer fra CPSUs 22. og 23. kongresser, sovjetiske aviser. Ord sovjetisk Og kamerat er inkludert i de første hundre russiske ordene, sammen med funksjonsord (de forekommer oftere enn ord hvor, her, din), ord parti, revolusjon, kommunist forekomme oftere enn tilbake, rundt, bedre etc. Til slutt eksisterer ikke listen over ord fra Zasorinas ordbok i elektronisk form.

Listen over ord tilgjengelig fra denne siden inneholder omtrent 35 000 ord med en frekvens på over 1 ipm (forekomster per million ord, forekomster per million ord). Det er også en kortere liste over de 5000 vanligste russiske ordene. Listene bruker den kyrilliske utf8-kodingen og er komprimert med WinZip-verktøyet (Linux- eller Mac-brukere kan bruke StuffIt til å pakke ut).

Strukturen til listene følger formatet til lemmatiserte lister fra British National Corpus (BNC), opprettet av Adam Kilgariff, som følger:
ordinærtall, frekvens (ipm), lemma, ordledd (BNC-klassifisering).

Ord med frekvens større enn 1 ipm

  • - ordformer sortert etter frekvens

Liste over 5000 vanligste ord

  • - Lemmaer sortert i alfabetisk rekkefølge
  • - Lemmaer sortert etter frekvens

Litt statistikk om bruken av russiske ord

  • Gjennomsnittlig ordlengde er 5,28 tegn.
  • Gjennomsnittlig setningslengde er 10,38 ord.
  • De 1000 hyppigste lemmaene dekker 64,0708 % av teksten.
  • De 2000 hyppigste lemmaene dekker 71,9521 % av teksten.
  • De 3000 hyppigste lemmaene dekker 76,5104 % av teksten.
  • De 5000 hyppigste lemmaene dekker 82,0604 % av teksten.

Mer full informasjon Samsvaret mellom ordfrekvens og korpusdekning finnes.

Listen er basert på et representativt korpus av det moderne russiske språket. Den inkluderer et utvalg samtidsprosa, politiske memoarer, samtidsaviser og sakprosa (omtrent 40 millioner ord, med prosa som utgjør omtrent halvparten av volumet). Alle tekstene i korpuset ble skrevet på russisk mellom 1970 og 2002; flertallet mellom 1980 og 1995, aviskorpus 1997-1999 (korpuset er basert på tekster fra Moshkov-biblioteket og korpuset av moderne journalistikk av A.V. Baranov).

Det er velkjent at store tekster utgjør et problem for sammenstilling av frekvenslister, siden en relativt lang tekst kan inneholde et stort nummer av forekomster av noen sjeldne ord, som vil øke frekvensen betydelig i den endelige listen. For eksempel korpuset som ble brukt til å kompilere denne listen, inneholder en variant over temaet til Tolkiens «Ringenes Herre» (forfatter Nick Perumov). Til tross for at lengden på denne romanen er 250 tusen ord, mindre enn én prosent av hele korpuset, bruker frekvensen av ordet hobbiten i denne romanen setter det i de første tusen russiske ordene, hvis frekvensen telles på tvers av alle tekster uten begrensninger på lengden. Av denne grunn ble frekvenslister satt sammen under forutsetning av at utvalget fra store tekster er begrenset til 10 tusen ord, og utvalget fra tekster til én forfatter er mindre enn 100 tusen ord. Som et resultat er undergruppen av hele korpuset som brukes i frekvensberegninger omtrent 16 millioner ord.

Ordfordelingen i tekstene er langt fra enhetlig. Noen ord (for eksempel preposisjoner) forekommer i mange tekster med ganske forutsigbar frekvens. Frekvensen av andre (for eksempel pronomen eller mentale verb) avhenger betydelig av forfatteren eller sjangeren til teksten, mens mange ord er "smittsomme": hvis dette ordet (for eksempel et egennavn, en betegnelse på en person etter rangering) eller posisjon, eller et teknisk begrep) forekommer én gang i teksten, er det svært sannsynlig at det vil bli gjentatt der mange flere ganger, og dermed øke frekvensen betydelig i dokumentet. Eksistere forskjellige måter målinger av slik variasjon (Church, K. og Gale, W. (1995) Poisson Mixtures, Journal of Natural Language Engineering, 1:2). Den enkleste måten for å vurdere oppførselen til et ord: beregn variasjonskoeffisienten, som beregnes som standardavviket delt på gjennomsnittsverdien. Standardavviket gir den absolutte verdien av variasjonen i et datasett (den øker for ord med høyere gjennomsnittsfrekvens), mens variasjonskoeffisienten sammenligner fordelingen av ord med ulik gjennomsnittsfrekvens. Avviksverdiene for de 5000 vanligste ordene kan sees. Filstruktur:
lemma, gjennomsnittlig frekvens (ipm), antall tekster som dette ordet forekommer i, standardavvik for frekvens for alle tekster, variasjonskoeffisient, spredning.

Korpuset, verktøy for å jobbe med det, så vel som det parallelle engelsk-russiske korpuset (setningsbasert justering) er beskrevet spesielt i følgende publikasjon av forfatteren:

Sharoff, Serge, (2002). Betydning som bruk: utnyttelse av justerte korpus for kontrastiv studie av leksikalsk semantikk. Proc. av språkressurser og evalueringskonferanse (LREC02). mai 2002, Las Palmas, Spania.

Det finnes også separate frekvenslister for følgende ordklasser:

Opprettelsen av korpuset og utviklingen av tilhørende programvare og frekvenslister ble støttet av et stipend gitt til forfatteren av Humboldt Foundation, Tyskland. Lemmatisering for analyse av ordformer i korpus ble utført ved bruk av Dialing morfologiske analysator. Siden mange ordformer er tvetydige (f.eks. kjære, var, stål, for, tre, allerede), frekvensen til noen ord er ikke helt pålitelig, for eksempel Til behandles som et verb bare hvis det ikke etterfølges av et substantiv, adjektiv eller pronomen, bli har alltid vært betraktet som et substantiv, for ektefeller ble alltid valgt ektefelle hvis mulig ektefelle Og ektefeller(flertall). Kriteriene for å velge en ordform var:

  1. frekvensen av det tilsvarende lemmaet ( tok den, jeg skal gi den til deg ettersom et substantiv er ekstremt usannsynlig, så i disse tilfellene velges et verb);
  2. komparativ frekvens av en bestemt form (begge lemmas for bli er ganske hyppige, men substantivet, i motsetning til verbet, brukes veldig ofte i denne formen; form det er på tide må telles i predikativ bruk, mens substantivet vises i alle andre former).
I likhet med Zasorinas etternavnsordbok ble fornavn og patronymer filtrert fra lemmatiserte frekvenslister, men geografiske navn venstre fordi det er vanskelig å rettferdiggjøre hvorfor de ble igjen i Zasorinas ordbok Moskva eller amerikansk, men ikke Moskva Og Amerika. Frekvenslisten over ordformer ble ikke filtrert.

substantiv e er en uavhengig betydelig del av talen, og kombinerer ord som

1) ha en generalisert betydning av objektivitet og svare på spørsmålene hvem? eller hva?;

2) er egennavn eller vanlige substantiv, levende eller livløse, har et konstant kjønnstegn og inkonsekvente (for de fleste substantiver) tall- og kasustegn;

3) i en setning fungerer de oftest som subjekter eller objekter, men kan være andre medlemmer av setningen.

Substantiv- dette er en del av talen, når uthevet, kommer de grammatiske trekkene til ord frem. Når det gjelder betydningen av substantiver, er dette den eneste delen av talen som kan bety noe: en gjenstand (bord), en person (gutt), et dyr (ku), et tegn (dybde), et abstrakt konsept (samvittighet), en handling (sang), relasjon (likhet). Fra et meningssynspunkt forenes disse ordene ved at de kan stilles spørsmålet hvem? eller hva?; Dette er faktisk deres objektivitet.

Vanlige substantiv utpeke objekter uten å skille dem fra klassen av samme type (by, elv, jente, avis).

Egensubstantiv utpeke objekter, skille dem fra klassen av homogene objekter, individualisere dem (Moskva, Volga, Masha, Izvestia). Det er nødvendig å skille egennavn fra egennavn - tvetydige navn på individualiserte objekter ("Evening Moscow"). Egennavn inkluderer ikke nødvendigvis fornavn(Moskva statsuniversitet).

Animerende og livløse substantiv

Substantiv har en permanent morfologiske trekk animasjon.

Tegnet på animasjon av substantiver er nært knyttet til begrepet levende / livløs. Likevel er animasjon ikke en betydningskategori, men et morfologisk trekk i seg selv.

Animasjon som morfologisk trekk har også formelle uttrykksmidler. For det første uttrykkes livløshet / livløshet ved endelsene på selve substantivet:

1) animere substantiv har samme flertallsendelser. tall V. p. og R. p., og for substantiver ektemann. Dette gjelder også enheter. Antall;

2) livløse substantiv har samme flertallsendelser. tall V. p. og I. p., og for substantiver ektemann. Dette gjelder også enheter. Antall.

Animasjonen til de fleste substantiver gjenspeiler en viss tilstand i den ekstraspråklige virkeligheten: animerte substantiver kalles hovedsakelig levende vesener, og livløse er livløse objekter, men det er tilfeller av brudd på dette mønsteret:


svingninger i animasjon

et objekt kan ikke være både levende og ikke-levende:
levende, men livløs

1) en samling av levende vesener:

(Jeg skjønner)hærer, folkemengder, folk ;

2) planter, sopp:

(samle)kantareller ;

livløs, men livlig

1) leker i form av en person:

(Jeg skjønner)dukker, hekkende dukker, tumblere ;

2) figurer av noen spill:

(spille)konger, dronninger ;

3) avdøde:

(Jeg skjønner)død, druknet , Mendød kropp (levende);

4) fiktive skapninger:

(Jeg skjønner)havfruer, nisser, brownies.

Substantiv har en konstant morfologisk kjønnsmarkør og forholde seg til mann, hunn eller intetkjønn.

Maskulint, feminint og intetkjønn inkluderer ord med følgende kompatibilitet:

Noen substantiv med endelsen -a, som angir egenskaper, egenskaper til personer, i I. p. har en dobbel kjønnskarakterisering avhengig av kjønnet til den utpekte personen:

din uvitenhet har kommet,

din uvitenhet kom.

Slike substantiv tilhører det generelle kjønn.

Kun substantiv flertall (krem, saks) tilhører ikke noen av kjønnene, siden de formelle forskjellene mellom substantiv av forskjellige kjønn i flertall ikke kommer til uttrykk (jf.: skrivebord - bord).

Substantiv endres etter tall og kasus. De fleste substantiv har entalls- og flertallsformer ( by - byer, landsby - landsbyer). Imidlertid har noen substantiv enten bare entallsform (f.eks. bondestand, asfalt, forbrenning), eller bare flertallsformen (f.eks. saks, rekkverk, hverdagsliv, Luzhniki).

Kasus som et morfologisk trekk ved substantiver

Substantiv endres etter bokstav, det vil si at de har et inkonsekvent morfologisk talltegn.

Det er 6 tilfeller i det russiske språket: nominativ (I. p.), genitiv (R. p.), dativ (D. p.), akkusativ (V. p.), instrumental (T. p.), preposisjonal (P.P.). Disse saksformene diagnostiseres i følgende sammenhenger:

I. p.hvem er dette? Hva?

R. p. ingen? hva?

D. p.glad for hvem? hva?

V. p. se hvem? Hva?

T.p.stolt av hvem? hvordan?

P.P. Jeg tenker på hvem? hvordan?

Endelsene på forskjellige kasus er forskjellige avhengig av hvilken deklinasjon substantivet tilhører.

Bøyning av substantiver

Å endre substantiv etter store og små bokstaver kalles deklinasjon.

TIL jeg deklinasjon inkludere substantiv ektemann. og koner snill med avslutning I. p. enhet. tall -a(-i), inkludert ord som slutter på -i: mom-a, dad-a, earth-ya, lecture-ya (lecture-a). Ord med en stamme som slutter på en hard konsonant (hard versjon), en myk konsonant (myk versjon) og med en stamme som slutter på -иj har noen forskjeller i endelser, for eksempel:

SakEntall
Solid alternativ
Mykt alternativ
på - og jeg
Navn Land - EN Jord -JEG Hæren -JEG
R.p. Land - s
Jord -Og Hæren -Og
D.p. Land - e Jord -e
Hæren -Og
V.p. Land - Jord -Yu Hæren -Yu
etc. Land -Au (-Åh )
Jord -til henne (-jojo ) Hæren -til henne (-henne )
P.p. Land -e Jord -e Hæren -Og

Co. II deklinasjon inkludere substantiv ektemann. kjønn med nullendelse I. p., inkludert ord som begynner med -iy, og substantiv m. og jfr. kjønn som slutter på -о(-е), inkludert ord som slutter på -е: bord-, geni-, by-o, vindu-o, halv-e, peni-e (penij-e).

TIL III deklinasjon inkludere substantiv kvinne. snill med null som slutter på I. p.: støv-, natt-.

I tillegg til substantiver som har endelser i bare én av disse deklinasjonene, er det ord som har en del av endelsene fra den ene deklinasjonen, og en del fra den andre. De kalles heterogene. Dette er 10 ord som begynner med -mya (byrde, tid, stigbøyle, stamme, frø, navn, flamme, banner, jur, krone) og sti.

I det russiske språket er det såkalte uavbrytelige substantiver. Disse inkluderer mange vanlige substantiv og personlige lån (frakk, Tokyo), russiske etternavn med -yh, -ikh, -vo (Petrovykh, Dolgikh, Durnovo). De beskrives vanligvis som ord uten slutt.

Morfologisk analyse av et substantiv

Substantivet er analysert i henhold til følgende plan:

JEG. Del av en tale. Generell verdi. Opprinnelig form(nominativ entall).

II. Morfologiske egenskaper:

1. Konstante tegn: a) egen- eller fellessubstantiv, b) livlig eller livløs, c) kjønn (maskulint, feminint, intetkjønn, vanlig), d) deklinasjon.
2. Ikke-konstante tegn: a) kasus, b) nummer.

III. Syntaktisk rolle.

Prøve morfologisk analyse substantiv

To damer løp opp til Luzhin og hjalp ham med å reise seg; han begynte å slå støvet av frakken med håndflaten (ifølge V. Nabokov).

JEG. Damer- substantiv;

innledende form - dame.

II. Konstante tegn: nat., sjel., kvinne. slekt, jeg klasse;

inkonsekvente tegn: flertall. nummer, I. p.

III. De løp opp(WHO?) damer (en del av faget).

JEG.(Til) Luzhin- substantiv;

innledende form - Luzhin;

II. Konstante tegn: egen, sjelfull, mannlig. slekt, jeg klasse;

inkonsekvente tegn: enheter. nummer, D. p.;

III.
De løp opp(til hvem?) .understrek (kant-bunn: 1px stiplet blå; ) til Luzhin(addisjon).

JEG. Palm- substantiv;

innledende form - håndflaten;

II.
Konstante tegn: nav., livløs., kvinnelig. slekt, jeg klasse;

inkonsekvente tegn: enheter. nummer, T. p.;

III.
Begynte å skyte ned(hvordan?) håndflaten(addisjon).

JEG. Støv- substantiv;

innledende form - støv;

II.
Konstante tegn: nav., livløs., kvinnelig. slekt, III klasse;

inkonsekvente tegn: enheter. nummer, V. p.;

III. Begynte å skyte ned(Hva?) støv(addisjon).

JEG. Frakk- substantiv;

innledende form - frakk;

II.
Konstante tegn: folkespråk, livløs, jfr. gen., ikke avvist;

inkonsistente tegn: antallet bestemmes ikke av konteksten, R. p.;

III. Begynte å skyte ned(Hvorfor?) med frakk(addisjon).

Laster inn...Laster inn...